Home Технологии Последние исследования DeepMind на ICLR 2022 | DeepTech

Последние исследования DeepMind на ICLR 2022 | DeepTech

0
Последние исследования DeepMind на ICLR 2022
 | DeepTech

Работа над большей обобщаемостью искусственного интеллекта

Сегодня сезон конференций начинается с Десятой Международной конференции по обучению представлений (ICLR 2022), который пройдет виртуально с 25 по 29 апреля 2022 года. Участники со всего мира собираются, чтобы поделиться своими передовыми разработками в области репрезентативного обучения, от передовых достижений в области искусственного интеллекта до науки о данных, машинного зрения, робототехники и более.

В первый день конференции Пушмит Кохли, руководитель наших групп ИИ для науки, а также групп надежного и проверенного ИИ, выступит с докладом о том, как ИИ может значительно улучшить решения широкого спектра научных проблем, от геномики и структурной биологии до квантовой физики. химия и даже чистая математика.

Помимо поддержки мероприятия в качестве спонсоров и организаторов регулярных семинаров, наши исследовательские группы представили 29 статей, включая 10 совместных работ в этом году. Вот краткий обзор наших предстоящих устных, обзорных и стендовых презентаций:

Оптимизация обучения

Ряд ключевых статей посвящен важнейшим способам повышения эффективности процесса обучения наших систем искусственного интеллекта. Это варьируется от повышения производительности, улучшения обучения за несколько шагов и создания эффективных систем обработки данных, которые сокращают вычислительные затраты.

В «Самозагрузочное метаобучение», Премия ICLR 2022 за выдающуюся бумагу победителем, мы предлагаем алгоритм, который позволяет агенту научиться учиться, обучая себя. Мы также представляем алгоритм улучшения политики который модернизирует AlphaZero — нашу систему, которая с нуля научилась освоить шахматы, сёги и го — чтобы продолжать совершенствоваться даже при обучении с небольшим количеством симуляций; а регуляризатор, который снижает риск потери емкости в широком спектре агентов и сред RL; и улучшенный архитектура для эффективной тренировки моделей внимания.

Исследование

Любопытство — ключевая часть человеческого обучения, помогающая совершенствовать знания и навыки. Точно так же механизмы исследования позволяют агентам ИИ выходить за рамки уже существующих знаний и открывать неизведанное или пробовать что-то новое.

Продвижение вопроса»Когда агентам следует исследовать?», мы исследуем, когда агенты должны переключаться в режим исследования, в какие сроки имеет смысл переключаться и какие сигналы лучше всего определяют, насколько продолжительными и частыми должны быть периоды исследования. В другой статье мы представляем «бонус за получение информации», что позволяет агентам выйти за рамки внутренних вознаграждений в RL и получить возможность освоить больше навыков.

Надежный ИИ

Чтобы развернуть модели машинного обучения в реальном мире, они должны быть эффективными при переключении между обучением, тестированием и использованием новых наборов данных. Понимание причинных механизмов имеет важное значение, позволяя некоторым системам адаптироваться, в то время как другие с трудом справляются с новыми проблемами.

Расширяя исследования этих механизмов, мы представляем экспериментальную структуру, которая позволяет анализ устойчивости к сдвигам распределения. Надежность также помогает защититься от враждебного вреда, как непреднамеренного, так и целенаправленного. В случае повреждения изображений мы предлагаем метод, который теоретически оптимизирует параметры моделей изображение-изображение чтобы уменьшить эффекты размытия, тумана и других распространенных проблем.

Экстренная связь

Помимо помощи исследователям МО понять, как агенты развивают свое собственное общение для выполнения задач, агенты ИИ могут раскрыть понимание языкового поведения внутри популяций, что может привести к созданию более интерактивного и полезного ИИ.

Работая с исследователями из Inria, Google Research и Meta AI, мы связываем роль разнообразия в человеческих популяциях в формировании языка с частично разрешить кажущееся противоречие в компьютерном моделировании с использованием нейронных агентов. Затем, поскольку создание лучших представлений языка в ИИ жизненно важно для понимания возникающей коммуникации, мы также исследуем важность расширения масштабов набор данных, сложность задачи и размер популяции как независимые аспекты. Кроме того, мы также изучили компромиссы между выразительностью, сложностью и непредсказуемостью в играх, где несколько агентов общаются для достижения одной цели.

Полный спектр наших работ смотрите на ICLR 2022 здесь.

LEAVE A REPLY

Please enter your comment!
Please enter your name here