-2.3 C
New York

AlphaGeometry: система искусственного интеллекта олимпиадного уровня по геометрии. | DeepTech

Published:

Исследовать

Опубликовано
Авторы

Триу Трин и Тханг Луонг

Наша система искусственного интеллекта превосходит самые современные подходы к решению задач геометрии, развивая рассуждения искусственного интеллекта в математике.

Отражая олимпийский дух древней Греции, Международная математическая олимпиада — это современная арена для самых талантливых математиков средней школы мира. Конкурс не только демонстрирует молодые таланты, но и стал испытательной площадкой для передовых систем искусственного интеллекта в области математики и рассуждения.

В статье, опубликованной сегодня в Природа, мы представляем AlphaGeometry, систему искусственного интеллекта, которая решает сложные геометрические задачи на уровне, приближающемся к золотому медалисту олимпиады среди людей, — это прорыв в производительности искусственного интеллекта. В сравнительном тесте из 30 олимпиадных задач по геометрии AlphaGeometry решила 25 в пределах стандартного олимпиадного времени. Для сравнения: предыдущая современная система решила 10 таких задач по геометрии, а среднестатистический золотой медалист решил 25,9 задач.

В нашем тестовом наборе из 30 олимпиадных задач по геометрии (IMO-AG-30), составленном на основе олимпиад с 2000 по 2022 год, AlphaGeometry решила 25 задач в рамках ограничений по времени соревнований. Это приближается к среднему баллу золотых медалистов среди людей по тем же задачам. Предыдущий современный подход, известный как «метод Ву», позволил решить 10 проблем.

Системы искусственного интеллекта часто сталкиваются со сложными задачами по геометрии и математике из-за отсутствия навыков рассуждения и данных для обучения. Система AlphaGeometry сочетает в себе прогностическую силу модели нейронного языка с механизмом вывода, основанным на правилах, которые работают в тандеме для поиска решений. А разработав метод генерации обширного пула синтетических обучающих данных — 100 миллионов уникальных примеров — мы можем обучать AlphaGeometry без каких-либо демонстраций с участием человека, обходя узкие места в данных.

С помощью AlphaGeometry мы демонстрируем растущую способность ИИ рассуждать логически, а также открывать и проверять новые знания. Решение задач по геометрии уровня олимпиады — важная веха в развитии глубоких математических рассуждений на пути к более совершенным и общим системам искусственного интеллекта. Мы открываем исходный код Код и модель AlphaGeometryи надеемся, что вместе с другими инструментами и подходами к созданию и обучению синтетических данных это поможет открыть новые возможности в области математики, науки и искусственного интеллекта.

Сейчас для меня совершенно логично, что исследователи в области искусственного интеллекта сначала пробуют свои силы в решении задач геометрии IMO, потому что поиск решений для них немного похож на шахматы в том смысле, что на каждом этапе у нас довольно небольшое количество разумных ходов. Но я все еще нахожу потрясающим то, что они смогли заставить это работать. Это впечатляющее достижение.

Нго Бао Чау, медалист Филдса и золотой медалист ИМО

AlphaGeometry использует нейросимволический подход.

AlphaGeometry — это нейросимволическая система, состоящая из модели нейронного языка и механизма символической дедукции, которые работают вместе для поиска доказательств сложных геометрических теорем. Сродни идее «думать быстро и медленно», одна система обеспечивает быстрые, «интуитивные» идеи, а другая – более обдуманное, рациональное принятие решений.

Поскольку языковые модели превосходно выявляют общие закономерности и взаимосвязи в данных, они могут быстро предсказывать потенциально полезные конструкции, но часто им не хватает способности строго рассуждать или объяснять свои решения. С другой стороны, механизмы символического вывода основаны на формальной логике и используют четкие правила для получения выводов. Они рациональны и объяснимы, но могут быть «медленными» и негибкими – особенно когда решают большие и сложные проблемы самостоятельно.

Языковая модель AlphaGeometry направляет свой механизм символического вывода к вероятным решениям геометрических задач. Олимпиадные задачи по геометрии основаны на диаграммах, в которые необходимо добавить новые геометрические конструкции, прежде чем их можно будет решить, например точки, линии или круги. Языковая модель AlphaGeometry предсказывает, какие новые конструкции из бесконечного числа возможностей было бы наиболее полезно добавить. Эти подсказки помогают заполнить пробелы и позволяют символическому движку сделать дальнейшие выводы о диаграмме и приблизиться к решению.

AlphaGeometry решает простую задачу: учитывая диаграмму задачи и ее предпосылки теоремы (слева), AlphaGeometry (в центре) сначала использует свой символьный механизм для вывода новых утверждений о диаграмме до тех пор, пока не будет найдено решение или пока новые утверждения не будут исчерпаны. Если решение не найдено, языковая модель AlphaGeometry добавляет одну потенциально полезную конструкцию (синюю), открывая новые пути вывода для символьного механизма. Этот цикл продолжается до тех пор, пока не будет найдено решение (справа). В этом примере требуется только одна конструкция.

AlphaGeometry решает олимпиадную задачу: задача 3 Международной математической олимпиады 2015 года (слева) и сокращенная версия решения AlphaGeometry (справа). Синие элементы — это добавленные конструкции. Решение AlphaGeometry состоит из 109 логических шагов.

Создание 100 миллионов примеров синтетических данных

Геометрия опирается на понимание пространства, расстояния, формы и относительных положений и имеет фундаментальное значение для искусства, архитектуры, техники и многих других областей. Люди могут изучать геометрию, используя ручку и бумагу, изучая диаграммы и используя имеющиеся знания для открытия новых, более сложных геометрических свойств и отношений. Наш подход к созданию синтетических данных имитирует этот процесс создания знаний в масштабе, позволяя нам обучать AlphaGeometry с нуля, без каких-либо демонстраций с участием человека.

Используя высокопараллельные вычисления, система начала с создания одного миллиарда случайных диаграмм геометрических объектов и исчерпывающе определила все взаимосвязи между точками и линиями на каждой диаграмме. AlphaGeometry нашла все доказательства, содержащиеся в каждой диаграмме, а затем работала в обратном направлении, чтобы выяснить, какие дополнительные конструкции, если таковые имеются, необходимы для получения этих доказательств. Мы называем этот процесс «символическим выводом и отслеживанием».

Визуальные представления синтетических данных, сгенерированных AlphaGeometry.

Этот огромный пул данных был отфильтрован, чтобы исключить похожие примеры, в результате чего в окончательном наборе обучающих данных было 100 миллионов уникальных примеров различной сложности, из которых девять миллионов содержали добавленные конструкции. Благодаря такому большому количеству примеров того, как эти конструкции привели к доказательствам, языковая модель AlphaGeometry способна давать хорошие предложения для новых конструкций при возникновении олимпиадных задач по геометрии.

Новаторские математические рассуждения с помощью ИИ

Решение каждой олимпиадной задачи, предоставленное AlphaGeometry, проверялось и проверялось компьютером. Мы также сравнили его результаты с предыдущими методами искусственного интеллекта и с результатами человека на Олимпиаде. Кроме того, Эван Чен, тренер по математике и бывший золотой медалист олимпиад, оценил для нас ряд решений AlphaGeometry.

Чен сказал: «Результаты AlphaGeometry впечатляют, поскольку они проверяемы и понятны. Предыдущие решения проблем конкуренции, основанные на доказательствах, с помощью ИИ иногда оказывались неудачными (результаты были верными только иногда и требовали проверки человеком). У AlphaGeometry нет этого недостатка: ее решения имеют структуру, поддающуюся машинной проверке. Тем не менее, несмотря на это, его вывод по-прежнему удобочитаем для человека. Можно было бы представить компьютерную программу, решающую геометрические задачи с помощью систем координат грубой силы: страницы и страницы обдумывания утомительных алгебраических вычислений. AlphaGeometry — это не то. Он использует правила классической геометрии с углами и подобными треугольниками, как это делают ученики».

Результаты AlphaGeometry впечатляют, потому что они проверяемы и понятны… Он использует правила классической геометрии с углами и подобными треугольниками так же, как это делают студенты.

Эван Чен, тренер по математике и золотой призер олимпиад

Поскольку каждая олимпиада включает шесть задач, только две из которых обычно посвящены геометрии, AlphaGeometry может быть применена только к одной трети задач на данной олимпиаде. Тем не менее, одни только его геометрические возможности делают его первой моделью искусственного интеллекта в мире, способной преодолеть порог бронзовой медали IMO в 2000 и 2015 годах.

По геометрии наша система приближается к стандарту золотого медалиста IMO, но мы нацелены на еще большую награду: развитие логики для систем искусственного интеллекта следующего поколения. Учитывая более широкий потенциал обучения систем ИИ с нуля с использованием крупномасштабных синтетических данных, этот подход может определить, как системы ИИ будущего будут открывать новые знания в области математики и за ее пределами.

AlphaGeometry опирается на работу Google DeepMind и Google Research, чтобы стать пионером в математических рассуждениях с помощью ИИ – от исследования красоты чистой математики до решение математических и научных задач с помощью языковых моделей. А совсем недавно мы представили FunSearch, который сделал первые открытия в открытых задачах математических наук с использованием моделей большого языка.

Нашей долгосрочной целью остается создание систем искусственного интеллекта, способных обобщать математические области, разрабатывая сложные решения проблем и рассуждения, от которых будут зависеть общие системы искусственного интеллекта, при этом расширяя границы человеческого знания.

Related Articles

Recent articles