Прокладывая путь к универсальным системам с более эффективным и действенным ИИ
На этих выходных стартует тридцать девятая Международная конференция по машинному обучению (МКМЛ 2022) состоится 17–23 июля 2022 года в конференц-центре Балтимора в Мэриленде, США, и будет проводиться как гибридное мероприятие.
Исследователи, работающие в области искусственного интеллекта, науки о данных, машинного зрения, вычислительной биологии, распознавания речи и т. д., представляют и публикуют свои передовые работы в области машинного обучения.
Помимо спонсирования конференции и поддержки семинаров и социальных мероприятий, проводимых нашими давними партнерами. LatinX, Черный в ИИ, Квир в ИИи Женщины в машинном обучении, наши исследовательские группы представили 30 статей, в том числе 17 — в сотрудничестве с внешними организациями. Вот краткое введение в наши предстоящие устные и тематические презентации:
Эффективное обучение с подкреплением
Повышение эффективности алгоритмов обучения с подкреплением (RL) является ключом к созданию обобщенных систем искусственного интеллекта. Это включает в себя помощь в повышении точности и скорости работы, улучшении передачи и обучения с нуля, а также сокращении вычислительных затрат.
В одном из избранных нами устных докладов мы показываем новый способ применения общего улучшения политики (GPI) над составом политик, что делает его еще более эффективным в повышении эффективности работы агента. В другом устном докладе был предложен новый обоснованный и масштабируемый способ эффективно исследуйте без необходимости бонусов. Параллельно мы предлагаем метод дополнение агента RL процессом поиска на основе памятиуменьшая зависимость агента от возможностей его модели и позволяя быстро и гибко использовать прошлый опыт.
Прогресс в языковых моделях
Язык является фундаментальной частью человеческого бытия. Это дает людям возможность передавать мысли и концепции, создавать воспоминания и укреплять взаимопонимание. Изучение аспектов языка является ключом к пониманию того, как работает интеллект как в системах искусственного интеллекта, так и у людей.
Наше устное сообщение о единые законы масштабирования и наша статья о retrieval оба исследуют, как мы могли бы более эффективно строить более крупные языковые модели. Рассматривая способы построения более эффективных языковых моделей, мы представляем новый набор данных и тест с СтримингQA который оценивает, как модели со временем адаптируются к новым знаниям и забывают их, а наша статья о генерация повествования показывает, как современные предварительно обученные языковые модели все еще не справляются с созданием более длинных текстов из-за ограничений кратковременной памяти.
Алгоритмические рассуждения
Нейронно-алгоритмическое мышление — это искусство создания нейронных сетей, способных выполнять алгоритмические вычисления. Эта растущая область исследований имеет большой потенциал для адаптации известных алгоритмов к реальным проблемам.
Мы представляем Тест CLRS для алгоритмических рассуждений, который оценивает выполнение нейронными сетями разнообразного набора из тридцати классических алгоритмов из учебника «Введение в алгоритмы». Аналогичным образом мы предлагаем общий алгоритм постепенного обучения который адаптирует воспроизведение ретроспективного опыта для автоматического доказательства теорем, важного инструмента, помогающего математикам доказывать сложные теоремы. Кроме того, мы представляем основа для обучения моделированию на основе ограниченийдемонстрирующий, как традиционное моделирование и численные методы могут использоваться в симуляторах машинного обучения – важном новом направлении для решения сложных задач моделирования в науке и технике.
Полный спектр наших работ смотрите на ICML 2022. здесь.