Изучение безопасности, адаптивности и эффективности искусственного интеллекта в реальном мире
На следующей неделе начнется 40-е Международная конференция по машинному обучению (ICML 2023), который пройдет 23–29 июля в Гонолулу, Гавайи.
ICML объединяет сообщество искусственного интеллекта (ИИ) для обмена новыми идеями, инструментами и наборами данных, а также установления связей для развития этой области. От компьютерного зрения до робототехники — исследователи со всего мира представят свои последние достижения.
Наш директор по науке, технологиям и обществу Шакир Мохамед расскажет поговорим о машинном обучении с социальной цельюрешение проблем здравоохранения и климата, принятие социотехнических взглядов и укрепление глобальных сообществ.
Мы гордимся тем, что поддерживаем конференцию в качестве платинового спонсора и продолжаем работать вместе с нашими долгосрочными партнерами. LatinX в ИИ, Квир в ИИи Женщины в машинном обучении.
На конференции мы также демонстрируем демо-версии АльфаФолднаши достижения в области термоядерной науки и новые модели, такие как ПалМ-Э для робототехники и Фенаки для создания видео из текста.
В этом году исследователи Google DeepMind представят на ICML более 80 новых статей. Поскольку многие документы были поданы до того, как Google Brain и DeepMind объединили свои усилия, статьи, первоначально представленные в рамках филиала Google Brain, будут включены в Блог исследований Googleа в этом блоге представлены статьи, представленные в рамках DeepMind.
ИИ в (моделируемом) мире
Успех искусственного интеллекта, который может читать, писать и создавать, подкреплен базовыми моделями — системами искусственного интеллекта, обученными на обширных наборах данных, которые могут научиться выполнять множество задач. Наше последнее исследование показывает, как мы можем воплотить эти усилия в реальный мир, и закладывает основу для более эффективных и воплощенных агентов ИИ, которые смогут лучше понимать динамику мира, открывая новые возможности для более полезных инструментов ИИ.
В устной презентации мы познакомим вас с АдА, агент искусственного интеллекта, который может адаптироваться для решения новых проблем в моделируемой среде, как это делают люди. За считанные минуты AdA может решать сложные задачи: объединять объекты новыми способами, перемещаться по невидимым территориям и сотрудничать с другими игроками.
Аналогичным образом мы покажем, как можно использовать модели языка видения, которые помогут обучать воплощенных агентов – например, сообщая роботу, что он делает.
Будущее обучения с подкреплением
Чтобы разработать ответственный и заслуживающий доверия ИИ, мы должны понимать цели, лежащие в основе этих систем. В обучении с подкреплением это можно определить через вознаграждение.
В устном выступлении мы стремимся утвердить гипотезу о вознаграждении впервые было сформулировано Ричардом Саттоном, заявившим, что все цели можно рассматривать как максимизацию ожидаемого совокупного вознаграждения. Мы объясняем точные условия, при которых оно выполняется, и уточняем виды целей, которые могут – и не могут – быть достигнуты с помощью вознаграждения в общей форме задачи обучения с подкреплением.
При развертывании систем искусственного интеллекта они должны быть достаточно надежными для реального мира. Мы смотрим, как лучше обучать алгоритмы обучения с подкреплением в рамках ограниченийпоскольку инструменты ИИ часто приходится ограничивать из соображений безопасности и эффективности.
В нашем исследовании, получившем признание Премия ICML 2023 за выдающуюся бумагумы исследуем, как мы можем обучать модели сложной долгосрочной стратегии в условиях неопределенности с помощью игры с несовершенной информацией. Мы рассказываем, как модели могут выигрывать в играх для двух игроков, даже не зная позиции и возможных ходов другого игрока.
Проблемы на переднем крае ИИ
Люди могут легко учиться, адаптироваться и понимать мир вокруг нас. Разработка передовых систем искусственного интеллекта, способных обобщать, как это делает человек, поможет создать инструменты искусственного интеллекта, которые мы сможем использовать в повседневной жизни и решать новые задачи.
Один из способов адаптации ИИ — быстрое изменение своих прогнозов в ответ на новую информацию. В устном выступлении мы рассмотрим пластичность в нейронных сетях и как его можно потерять в процессе обучения – и способы предотвратить потерю.
Мы также представляем исследование, которое могло бы помочь объяснить тип контекстного обучения, возникающего в больших языковых моделях, путем изучения нейронные сети, метаобученные на данных источники, статистика которых меняется спонтанно, например, прогнозирование на естественном языке.
В устном докладе мы представляем новое семейство рекуррентных нейронных сетей. (RNN), которые лучше справляются с долгосрочными задачами рассуждения. чтобы раскрыть потенциал этих моделей в будущем.
Наконец, в ‘квантильное присвоение кредитаМы предлагаем подход, позволяющий отделить удачу от мастерства. Устанавливая более четкую взаимосвязь между действиями, результатами и внешними факторами, ИИ может лучше понимать сложные реальные среды.