Решение некоторых важнейших задач XXI века, таких как производство экологически чистой электроэнергии или разработка высокотемпературных сверхпроводников, потребует от нас разработки новых материалов с особыми свойствами. Чтобы сделать это на компьютере, необходимо смоделировать электроны — субатомные частицы, которые управляют тем, как атомы соединяются в молекулы, а также отвечают за поток электричества в твердых телах. Несмотря на десятилетия усилий и несколько значительных достижений, точное моделирование квантовомеханического поведения электронов остается открытой проблемой. Теперь, в бумага (PDF-файл с открытым доступом), опубликованном в журнале Science, мы предлагаем DM21, нейронную сеть, обеспечивающую современную точность в больших областях химии. Чтобы ускорить научный прогресс, мы также открываем исходный код наших код для использования кем угодно.
Почти столетие назад Эрвин Шредингер предложил его знаменитое уравнение управляющие поведением квантово-механических частиц. Применить это уравнение к электронам в молекулах сложно, поскольку все электроны отталкивают друг друга. Казалось бы, для этого потребуется отслеживать вероятность положения каждого электрона — чрезвычайно сложная задача даже для небольшого числа электронов. Один крупный прорыв произошел в 1960-х годах, когда Пьер Хоэнберг и Вальтер Кон поняли, что нет необходимости отслеживать каждый электрон индивидуально. Вместо этого, зная вероятность любой Наличие электрона в каждой позиции (т. е. плотность электронов) достаточна для точного расчета всех взаимодействий. Кон получил Нобелевская премия по химии доказав это, основав таким образом теорию функционала плотности (ТПФ).
Хотя метод DFT доказывает, что отображение существует, на протяжении более 50 лет точная природа этого отображения между электронной плотностью и энергией взаимодействия — так называемый функционал плотности — оставалась неизвестной и должна быть аппроксимирована. Несмотря на то, что ДПФ по своей сути предполагает уровень приближения, это единственный практический метод изучения того, как и почему материя ведет себя определенным образом на микроскопическом уровне, и поэтому он стал одним из наиболее широко используемых методов во всей науке. За прошедшие годы исследователи предложили множество приближений к точному функционалу с разным уровнем точности. Несмотря на свою популярность, все эти приближения страдают систематическими ошибками, поскольку не могут уловить некоторые важные математические свойства точного функционала.
Выражая функционал в виде нейронной сети и включая эти точные свойства в обучающие данные, мы изучаем функционалы, свободные от важных систематических ошибок, что приводит к лучшему описанию широкого класса химических реакций.
Мы специально решаем две давние проблемы с традиционными функционалами:
- Ошибка делокализации: В расчете DFT функционал определяет плотность заряда молекулы, находя конфигурацию электронов, которая минимизирует энергию. Таким образом, ошибки в функционале могут привести к ошибкам в расчете электронной плотности. Большинство существующих приближений функционала плотности предпочитают электронные плотности, которые нереально распределены по нескольким атомам или молекулам, а не правильно локализованы вокруг одной молекулы или атома (см. Рис. 2).
- Нарушение спиновой симметрии: При описании разрыва химических связей существующие функционалы имеют тенденцию нереалистично отдавать предпочтение конфигурациям, в которых нарушается фундаментальная симметрия, известная как спиновая симметрия. Поскольку симметрии играют жизненно важную роль в нашем понимании физики и химии, это искусственное нарушение симметрии обнаруживает серьезный недостаток существующих функционалов.
В принципе, любой химико-физический процесс, включающий перемещение заряда, подвержен ошибке делокализации, а любой процесс, включающий разрыв связей, подвержен нарушению спиновой симметрии. Движение заряда и разрыв связей являются основой многих важных технологических приложений, но эти проблемы также могут привести к массовому качественному отказу функционалов для описания простейших молекул, таких как водород. Поскольку ДПФ является столь важной технологией, важно разработать функционалы, которые правильно объяснят эту простую химию, прежде чем просить их объяснить гораздо более сложные молекулярные взаимодействия, например те, которые могут происходить в батарее или солнечном элементе.
Обе эти давние проблемы связаны с тем, как ведут себя функционалы, когда они представлены в системе, которая демонстрирует «дробный электронный характер». Используя нейронную сеть для представления функционала и адаптируя наш набор обучающих данных для захвата поведения дробного электрона, ожидаемого для точного функционала, мы обнаружили, что можем решить проблемы делокализации и нарушения спиновой симметрии. Наш функционал также показал себя очень точным на широких, крупномасштабных тестах, что позволяет предположить, что этот подход, основанный на данных, может уловить аспекты конкретного функционала, которые до сих пор были неуловимыми.
В течение многих лет компьютерное моделирование играло центральную роль в современной инженерии, позволяя дать надежные ответы на такие вопросы, как «устоит ли этот мост?» на «Полетит ли эта ракета в космос?» Поскольку технологии все чаще обращаются к квантовому масштабу для изучения вопросов о материалах, лекарствах и катализаторах, включая те, которые мы никогда не видели или даже не представляли, глубокое обучение обещает точно моделировать материю на этом квантовомеханическом уровне.