Home Технологии Последнее исследование Google DeepMind на ICML 2023 | DeepTech

Последнее исследование Google DeepMind на ICML 2023 | DeepTech

0
Последнее исследование Google DeepMind на ICML 2023
 | DeepTech

На следующей неделе начнется 40-летие. Международная конференция по машинному обучению (ICML 2023), который пройдет 23–29 июля в Гонолулу, Гавайи.

ICML объединяет сообщество искусственного интеллекта (ИИ), чтобы делиться новыми идеями, инструментами и наборами данных, а также устанавливать связи для продвижения в этой области. От компьютерного зрения до робототехники исследователи со всего мира представят свои последние достижения.

Наш директор по науке, технологиям и обществу Шакир Мохамед даст говорить о машинном обучении с социальной цельюрешение проблем, связанных со здравоохранением и климатом, применение социотехнической точки зрения и укрепление глобальных сообществ.

Мы гордимся тем, что поддерживаем конференцию в качестве платинового спонсора и продолжаем сотрудничество с нашими давними партнерами. LatinX в ИИ, Квир в ИИи Женщины в машинном обучении.

На конференции мы также демонстрируем демонстрации AlphaFold, наши достижения в области науки о термоядерном синтезе и новые модели, такие как ПАЛМ-Э для робототехники и Фенаки для создания видео из текста.

В этом году исследователи Google DeepMind представят на ICML более 80 новых статей. Поскольку многие документы были представлены до того, как Google Brain и DeepMind объединили свои усилия, документы, изначально представленные в рамках членства в Google Brain, будут представлены в Блог Google Researchв то время как в этом блоге представлены статьи, представленные в рамках членства в DeepMind.

ИИ в (симулированном) мире

Успех ИИ, который может читать, писать и создавать, подкреплен базовыми моделями — системами ИИ, обученными на обширных наборах данных, которые могут научиться выполнять множество задач. Наше последнее исследование изучает, как мы можем воплотить эти усилия в реальный мир, и закладывает основу для более способных и воплощенных агентов ИИ, которые могут лучше понимать динамику мира, открывая новые возможности для более полезных инструментов ИИ.

В устном изложении мы знакомим AdA, агент ИИ, который может адаптироваться для решения новых задач в смоделированной среде, как это делают люди. За считанные минуты AdA может выполнять сложные задачи: комбинировать объекты новыми способами, перемещаться по невидимым ландшафтам и сотрудничать с другими игроками.

Точно так же мы покажем, как мы могли бы использовать модели языка видения, помогающие обучать воплощённых агентов – например, сообщая роботу, что он делает.

Будущее обучения с подкреплением

Чтобы разработать ответственный и заслуживающий доверия ИИ, мы должны понимать цели, лежащие в основе этих систем. В обучении с подкреплением одним из способов определения этого является вознаграждение.

В устной презентации мы стремимся утвердить гипотезу вознаграждения впервые постулировал Ричард Саттон, заявив, что все цели можно рассматривать как максимизацию ожидаемого совокупного вознаграждения. Мы объясняем точные условия, при которых оно выполняется, и разъясняем виды целей, которые могут и не могут быть достигнуты с помощью вознаграждения в общей форме проблемы обучения с подкреплением.

При развертывании систем ИИ они должны быть достаточно надежными для работы в реальном мире. Мы смотрим, как лучше обучать алгоритмы обучения с подкреплением в рамках ограничений, поскольку инструменты ИИ часто приходится ограничивать в целях безопасности и эффективности. Мы также изучаем, как мы можем обучать модели сложной долгосрочной стратегии в условиях неопределенности с помощью несовершенные информационные игры, как покер. В устной презентации мы рассказываем, как модели могут играть, чтобы выигрывать игры для двух игроков, даже не зная позиции другого игрока и возможных ходов.

Проблемы на переднем крае ИИ

Люди могут легко учиться, адаптироваться и понимать окружающий мир. Разработка передовых систем ИИ, способных обобщать, как человек, поможет создать инструменты ИИ, которые мы сможем использовать в повседневной жизни и решать новые задачи.

Один из способов адаптации ИИ — быстрое изменение своих прогнозов в ответ на новую информацию. В устном изложении мы рассматриваем пластичность в нейронных сетях и как его можно потерять в процессе обучения – и способы предотвращения потери.

Мы также представляем исследование, которое могло бы помочь объяснить тип контекстного обучения, возникающего в больших языковых моделях, путем изучения нейронные сети метаобучаются на данных источники, статистика которых изменяется спонтанно, например, в прогнозировании естественного языка.

В устной презентации мы представляем новое семейство рекуррентных нейронных сетей (RNN), которые лучше справляются с долгосрочными логическими задачами. чтобы раскрыть потенциал этих моделей в будущем.

Наконец, в ‘присвоение квантиля кредитаМы предлагаем подход, позволяющий отделить удачу от мастерства. Устанавливая более четкую взаимосвязь между действиями, результатами и внешними факторами, ИИ может лучше понимать сложную среду реального мира.

LEAVE A REPLY

Please enter your comment!
Please enter your name here