Представьте, что вы наслаждаетесь пикником на берегу реки в ветреный день. Порыв ветра случайно подхватывает вашу бумажную салфетку и приземляется на поверхность воды, быстро унося от вас. Вы берете ближайшую палку и осторожно взбалтываете воду, чтобы поднять ее, создавая серию небольших волн. Эти волны в конце концов отбрасывают салфетку обратно к берегу, так что вы хватаете ее. В этом сценарии вода действует как среда для передачи сил, позволяя вам управлять положением салфетки без прямого контакта.
Люди регулярно взаимодействуют с различными типами жидкостей в своей повседневной жизни, но это было сложной и неуловимой целью для современных роботизированных систем. Дать тебе латте? Это может сделать робот. Сделай это? Это потребует немного больше нюансов.
FluidLab, новый инструмент моделирования от исследователей из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL), улучшает обучение роботов для сложных задач манипулирования жидкостью, таких как приготовление латте-арта, мороженого и даже манипулирование воздухом. Виртуальная среда предлагает разнообразный набор сложных задач по работе с жидкостями, включая твердые и жидкие вещества, а также несколько жидкостей одновременно. FluidLab поддерживает моделирование твердых тел, жидкостей и газов, включая упругие, пластиковые, твердые объекты, ньютоновские и неньютоновские жидкости, а также дым и воздух.
В основе FluidLab лежит FluidEngine, простой в использовании физический симулятор, способный беспрепятственно рассчитывать и моделировать различные материалы и их взаимодействия, используя при этом мощность графических процессоров (GPU) для более быстрой обработки. Движок является «дифференциальным», что означает, что симулятор может использовать знания физики для более реалистичной модели физического мира, что приводит к более эффективному обучению и планированию роботизированных задач. Напротив, большинству существующих методов обучения с подкреплением не хватает той модели мира, которая зависит только от проб и ошибок. Эта расширенная возможность, говорят исследователи, позволяет пользователям экспериментировать с алгоритмами обучения роботов и играть с границами текущих возможностей манипулирования роботами.
Чтобы подготовить почву, исследователи протестировали указанные алгоритмы обучения роботов с помощью FluidLab, обнаруживая и преодолевая уникальные проблемы в жидкостных системах. Разработав умные методы оптимизации, они смогли эффективно перенести эти знания из моделирования в реальные сценарии.
«Представьте себе будущее, в котором домашний робот без труда поможет вам в повседневных задачах, таких как приготовление кофе, приготовление завтрака или ужина. Эти задачи включают в себя многочисленные проблемы с манипуляциями с жидкостями. Наш тест — это первый шаг к тому, чтобы дать роботам возможность овладеть этими навыками, принося пользу как дома, так и на рабочем месте», — говорит приглашенный исследователь MIT CSAIL и научный сотрудник лаборатории искусственного интеллекта Watson MIT-IBM Чуанг Ган, старший автор новой статьи о исследовать. «Например, эти роботы могут сократить время ожидания и повысить качество обслуживания клиентов в оживленных кофейнях. Насколько нам известно, FluidEngine — это первый в своем роде физический движок, который поддерживает широкий спектр материалов и соединений, будучи при этом полностью дифференцируемым. С помощью наших стандартизированных задач по манипулированию жидкостями исследователи могут оценить алгоритмы обучения роботов и раздвинуть границы современных возможностей манипулирования роботами».
Жидкая фантазия
За последние несколько десятилетий ученые в области манипулирования роботами в основном сосредоточились на манипулировании твердыми объектами или на очень упрощенных задачах манипулирования жидкостью, таких как выливание воды. Изучение этих задач манипуляции с жидкостями в реальном мире также может быть небезопасным и дорогостоящим делом.
Однако при манипуляциях с жидкостями речь идет не только о жидкостях. Во многих задачах, таких как создание идеального водоворота мороженого, смешивание твердых веществ с жидкостями или гребля по воде для перемещения объектов, это танец взаимодействия между жидкостями и различными другими материалами. Среды моделирования должны поддерживать «связь» или то, как взаимодействуют два разных свойства материала. Задачи манипуляций с жидкостями обычно требуют довольно тонкой точности, тонкого взаимодействия и обращения с материалами, что отличает их от простых задач, таких как толкание блока или открытие бутылки.
Симулятор FluidLab может быстро рассчитать, как различные материалы взаимодействуют друг с другом.
Помогает графическим процессорам «Taichi», предметно-ориентированный язык, встроенный в Python. Система может вычислять градиенты (скорости изменения конфигурации окружающей среды по отношению к действиям робота) для различных типов материалов и их взаимодействия (связей) друг с другом. Эта точная информация может быть использована для точной настройки движений робота для повышения производительности. В результате симулятор позволяет находить более быстрые и эффективные решения, что выгодно отличает его от аналогов.
10 задач, поставленных командой, делятся на две категории: использование жидкостей для манипулирования труднодоступными объектами и непосредственное манипулирование жидкостями для конкретных целей. Примеры включали разделение жидкостей, управление плавающими объектами, транспортировку предметов с помощью струй воды, смешивание жидкостей, создание латте-арта, придание формы мороженому и управление циркуляцией воздуха.
«Симулятор работает аналогично тому, как люди используют свои ментальные модели для прогнозирования последствий своих действий и принятия обоснованных решений при манипулировании жидкостями. Это значительное преимущество нашего симулятора по сравнению с другими», — говорит аспирант Университета Карнеги-Меллона Чжоу Сянь, еще один автор статьи. «В то время как другие симуляторы в основном поддерживают обучение с подкреплением, наш поддерживает обучение с подкреплением и позволяет использовать более эффективные методы оптимизации. Использование градиентов, предоставляемых симулятором, поддерживает высокоэффективный поиск политик, что делает его более универсальным и эффективным инструментом».
Следующие шаги
Будущее FluidLab выглядит светлым. В текущей работе была предпринята попытка перенести траектории, оптимизированные в моделировании, на задачи реального мира напрямую без обратной связи. Для следующих шагов команда работает над разработкой политики замкнутого цикла в моделировании, которая принимает в качестве входных данных состояние или визуальные наблюдения за средами и выполняет задачи манипуляции с жидкостью в режиме реального времени, а затем переносит изученные политики в сцены реального мира. .
Платформа находится в открытом доступе общедоступныйи исследователи надеются, что это поможет будущим исследованиям в разработке более совершенных методов решения сложных задач манипулирования жидкостями.
«Люди взаимодействуют с жидкостями в повседневных задачах, включая наливание и смешивание жидкостей (кофе, йогурты, супы, жидкое тесто), мытье и мытье водой и многое другое», — говорит профессор информатики Университета Мэриленда Минг Лин, который не участвовал в исследовании. работа. «Для того, чтобы роботы помогали людям и выполняли аналогичные функции в повседневных задачах, потребуются новые методы взаимодействия и обращения с различными жидкостями с разными свойствами (например, вязкостью и плотностью материалов). временные автономные системы. В этой работе представлен первый всеобъемлющий физический движок FluidLab, позволяющий моделировать разнообразные сложные жидкости и их связь с другими объектами и динамическими системами в окружающей среде. Математическая формулировка «дифференцируемых жидкостей», представленная в статье, позволяет интегрировать универсальное моделирование жидкости в качестве сетевого уровня в алгоритмы на основе обучения и архитектуры нейронных сетей для интеллектуальных систем, работающих в реальных приложениях».
Ган и Сянь написали статью вместе с Сяо-Ю Тунгом, постдоком в отделе мозга и когнитивных наук Массачусетского технологического института; Антонио Торральба, профессор электротехники и информатики Массачусетского технологического института и главный исследователь CSAIL; Доцент Дартмутского колледжа Бо Чжу, аспирант Колумбийского университета Чжэньцзя Сюй и доцент КМУ Катерина Фрагкиадаки. Исследования команды поддерживаются Лабораторией искусственного интеллекта Watson AI Lab MIT-IBM, Sony AI, премией DARPA для молодых исследователей, премией NSF CAREER, премией AFOSR для молодых исследователей, DARPA Machine Common Sense и Национальным научным фондом.
Исследование было представлено на Международной конференции по обучающим представлениям ранее в этом месяце.
Новости Массачусетского технологического института