Рэйчел Гордон | Массачусетский технологический институт CSAIL
В безбрежном бескрайнем небе, где когда-то безраздельно властвовали птицы, взлетает новая группа авиаторов. Эти пионеры воздуха — не живые существа, а скорее продукт преднамеренных инноваций: дроны. Но это не типичные летающие боты, жужжащие, как механические пчелы. Скорее, это чудеса, вдохновленные птицами, которые парят в небе, управляемые гибкими нейронными сетями, чтобы с точностью и легкостью ориентироваться в постоянно меняющихся и невидимых средах.
Вдохновленные адаптируемой природой органического мозга, исследователи из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) представили метод, позволяющий надежным пилотажным навигационным агентам справляться с задачами полета к цели на основе зрения в сложных, незнакомых условиях. Жидкие нейронные сети, которые могут постоянно адаптироваться к новым входным данным, продемонстрировали мастерство в принятии надежных решений в неизвестных областях, таких как леса, городские ландшафты и среды с добавленным шумом, вращением и окклюзией. Эти адаптируемые модели, которые превзошли многие современные аналоги в навигационных задачах, могут позволить потенциальные реальные приложения дронов, такие как поиск и спасение, доставка и наблюдение за дикой природой.
Недавнее исследование исследователей, опубликовано в Научная робототехника, подробно рассказывается, как этот новый вид агентов может адаптироваться к значительным изменениям в распределении, что является давней проблемой в этой области. Однако новый класс алгоритмов машинного обучения команды фиксирует причинно-следственную структуру задач из многомерных неструктурированных данных, таких как входные данные пикселей с камеры, установленной на дроне. Затем эти сети могут извлекать важные аспекты задачи (т. е. понимать стоящую перед ней задачу) и игнорировать нерелевантные функции, позволяя приобретенным навыкам навигации беспрепятственно переносить цели в новые среды.
Дроны перемещаются в невидимой среде с помощью гибких нейронных сетей.
«Мы в восторге от огромного потенциала нашего подхода к управлению роботами на основе обучения, поскольку он закладывает основу для решения проблем, возникающих при обучении в одной среде и развертывании в совершенно другой среде без дополнительного обучения», — говорит Даниэла Рус, CSAIL. директор и Эндрю (1956) и Эрна Витерби, профессор электротехники и компьютерных наук в Массачусетском технологическом институте. «Наши эксперименты показывают, что мы можем эффективно научить дрон находить объект в лесу летом, а затем развертывать модель зимой, в самых разных условиях или даже в городских условиях, с различными задачами, такими как поиск и отслеживание. Эта адаптивность стала возможной благодаря каузальным основам наших решений. Эти гибкие алгоритмы однажды могут помочь в принятии решений на основе потоков данных, которые со временем меняются, таких как медицинская диагностика и приложения для автономного вождения».
На переднем плане стояла сложнейшая задача: понимают ли системы машинного обучения задачу, которую им дают данные при полете дронов к немаркированному объекту? И смогут ли они перенести свои приобретенные навыки и задачи в новые условия с резкими изменениями пейзажа, например, при полете из леса в городской пейзаж? Более того, в отличие от замечательных способностей нашего биологического мозга, системы глубокого обучения с трудом улавливают причинно-следственные связи, часто подгоняют свои обучающие данные и не могут адаптироваться к новой среде или меняющимся условиям. Это особенно тревожно для встраиваемых систем с ограниченными ресурсами, таких как воздушные дроны, которым необходимо перемещаться в различных средах и мгновенно реагировать на препятствия.
Жидкие сети, напротив, предлагают многообещающие предварительные признаки их способности устранить эту критическую слабость в системах глубокого обучения. Система команды была сначала обучена на данных, собранных пилотом-человеком, чтобы увидеть, как они переносят полученные навыки навигации в новые условия при резких изменениях пейзажа и условий. В отличие от традиционных нейронных сетей, которые обучаются только на этапе обучения, параметры гибкой нейронной сети могут меняться со временем, что делает их не только интерпретируемыми, но и более устойчивыми к неожиданным или зашумленным данным.
В серии экспериментов с замкнутым контуром управления квадрокоптерами дроны прошли тесты на дальность, стресс-тесты, вращение цели и окклюзию, походы с противниками, треугольные петли между объектами и динамическое отслеживание цели. Они отслеживали движущиеся цели и выполняли многоступенчатые циклы между объектами в невиданной ранее среде, превосходя по производительности другие передовые аналоги.
Команда считает, что способность учиться на ограниченных экспертных данных и понимать поставленную задачу при обобщении на новые среды может сделать автономное развертывание беспилотных летательных аппаратов более эффективным, экономичным и надежным. Они отметили, что жидкие нейронные сети могут позволить использовать автономные беспилотные летательные аппараты для мониторинга окружающей среды, доставки посылок, автономных транспортных средств и роботов-помощников.
«Экспериментальная установка, представленная в нашей работе, проверяет возможности рассуждений различных систем глубокого обучения в контролируемых и простых сценариях», — говорит исследовательский филиал MIT CSAIL. Рамин Хасани. «Осталось еще так много места для будущих исследований и разработок более сложных логических задач для систем ИИ в автономных навигационных приложениях, которые необходимо протестировать, прежде чем мы сможем безопасно развернуть их в нашем обществе».
«Надежное обучение и производительность в задачах и сценариях, не связанных с распространением, являются одними из ключевых проблем, которые должны решить машинное обучение и автономные роботизированные системы, чтобы добиться дальнейшего успеха в критически важных для общества приложениях», — говорит Алессио Ломусцио, профессор безопасности ИИ в факультет вычислительной техники Имперского колледжа Лондона. «В этом контексте производительность жидких нейронных сетей, новой парадигмы, вдохновленной мозгом, разработанной авторами из Массачусетского технологического института, о которой сообщается в этом исследовании, замечательна. Если эти результаты подтвердятся в других экспериментах, разработанная здесь парадигма поможет сделать ИИ и роботизированные системы более надежными, надежными и эффективными».
Ясно, что небо больше не предел, а скорее обширная площадка для безграничных возможностей этих воздушных чудес.
Хасани и аспирант Макрам Шахин; Патрик Као ’22, MEng ’22; и аспирант Аарон Рэй SM ’21 написал статью с Райаном Шубертом ’20, MEng ’22; постдоки Массачусетского технологического института Матиас Лехнер и Александр Амини; и Даниэла Рус.
Это исследование было частично поддержано Schmidt Futures, Исследовательской лабораторией ВВС США, Ускорителем искусственного интеллекта ВВС США и компанией Boeing Co.
Новости Массачусетского технологического института