Исследовать
О решении проблемы сворачивания белка читайте на сайте deepmind.com/AlphaFold и посмотрите график нашего прорыва здесь.
Прошел год с тех пор, как мы выпустили и открыли исходный код AlphaFold, нашей системы искусственного интеллекта для прогнозирования трехмерной структуры белка только на основе его одномерной аминокислотной последовательности, и создали База данных структуры белков AlphaFold (AlphaFold DB), чтобы свободно делиться этими научными знаниями со всем миром. Белки являются строительными блоками жизни, они лежат в основе всех биологических процессов во всех живых существах. А поскольку форма белка тесно связана с его функцией, знание структуры белка позволяет лучше понять, что он делает и как работает. Мы надеялись, что этот новаторский ресурс поможет ускорить научные исследования и открытия во всем мире, и что другие команды смогут извлечь уроки из достижений, достигнутых нами с помощью AlphaFold, и использовать их для достижения дальнейших прорывов. Эта надежда стала реальностью гораздо быстрее, чем мы смели мечтать. Всего двенадцать месяцев спустя к AlphaFold получили доступ более полумиллиона исследователей, и они использовались для ускорения прогресса в решении важных реальных проблем, начиная от пластиковое загрязнение к устойчивость к антибиотикам.
Сегодня я невероятно рад поделиться следующим этапом этого путешествия. В партнерстве с EMBL Европейский институт биоинформатики (EMBL-EBI)сейчас мы публикуем предсказанные структуры почти для всех известных науке каталогизированных белков, что расширит АльфаФолд БД более чем в 200 раз – от почти 1 миллиона структур до более 200 миллионов структур – с потенциалом значительно улучшить наше понимание биологии.
Это обновление включает в себя предсказанные структуры растений, бактерий, животных и других организмов, открывая множество новых возможностей для исследователей использовать AlphaFold для продвижения своей работы по важным вопросам, включая устойчивость, отсутствие продовольственной безопасности и забытые болезни.
Сегодняшнее обновление означает, что большинство страниц в основной базе данных белков ЮниПрот будет иметь предсказуемую структуру. Все более 200 миллионов структур также будут доступны для массовой загрузки через Общедоступные наборы данных Google Cloudчто делает AlphaFold еще более доступным для ученых всего мира.
Влияние AlphaFold на данный момент
Спустя двенадцать месяцев после первого выпуска AlphaFold было удивительно размышлять о невероятном влиянии, которое AlphaFold уже оказал, и о нашем долгом пути к достижению сегодняшнего рубежа.
Для нашей команды успех AlphaFold был особенно полезен как потому, что это была самая сложная система искусственного интеллекта, которую мы когда-либо создавали, требующая множества важных инноваций, так и потому, что она оказала наиболее значимое влияние на последующие процессы. Продемонстрировав, что ИИ может точно предсказать форму белка с точностью до атома, в масштабе и за считанные минуты, AlphaFold не только предоставила решение грандиозной задачи 50-летней давности, но и стала первым большим доказательством нашего основополагающего тезиса: что искусственный интеллект может значительно ускорить научные открытия и, в свою очередь, продвинуть человечество.
Мы открыли исходный код AlphaFold и опубликовали две подробные статьи в журнале Nature (1, 2), которые уже цитировались более 4000 раз. Мы тесно сотрудничали с ведущей в мире компанией EMBL-EBI для разработки инструмента, который лучше всего поможет биологам получить доступ к AlphaFold и использовать его, и вместе выпустили AlphaFold DB, базу данных с возможностью поиска, которая открыта и бесплатна для всех. Прежде чем выпустить AlphaFold, в соответствии с нашим тщательным и ответственным подходом к новаторству, мы обратились к более чем 30 экспертам в области биологических исследований, безопасности, этики и безопасности, чтобы помочь нам понять, как поделиться преимуществами AlphaFold с миром таким образом, чтобы позволит максимизировать потенциальную выгоду и минимизировать потенциальный риск.
На сегодняшний день более 500 000 исследователей из 190 стран получили доступ к базе данных AlphaFold для просмотра более 2 миллионов структур. Наши свободно доступные структуры также были интегрированы в другие общедоступные наборы данных, такие как Ensembl, UniProt и OpenTargets, где миллионы пользователей получают к ним доступ в рамках своих повседневных рабочих процессов.
Мы были поражены скоростью, с которой AlphaFold уже стал важным инструментом для сотен тысяч ученых в лабораториях и университетах по всему миру, помогающим им в их важной работе. Что касается нашей собственной работы с AlphaFold, мы отдавали приоритет приложениям, которые, по нашему мнению, могли бы принести наибольшую положительную социальную пользу, уделяя особое внимание инициативам, которые исторически недостаточно финансировались или игнорировались. Например, мы сотрудничали с Инициатива «Лекарства от забытых болезней» (DNDi) чтобы помочь продвинуть их исследования, приближая их к поиску жизненно важных лекарств от таких болезней, как Лейшманиоз и Болезнь Шагаса которые непропорционально сильно затрагивают людей в более бедных частях мира. Мы также поддержали Всемирный день забытых тропических болезней путем создания предсказаний структуры организмов, идентифицированных с помощью Всемирная организация здравоохранения в качестве первоочередной задачи своих исследований, помогая дальнейшему изучению таких заболеваний, как проказа и Шистосомозкоторые разрушают жизни более 1 миллиарда человек во всем мире.
Было так вдохновляюще видеть, как исследовательское сообщество использовало AlphaFold для самых разных целей: от понимание болезнейк защита медоносных пчелк расшифровка биологических загадокк глубже заглянуть в истоки самой жизни.
Другие впечатляющие примеры, выбранные членами нашей команды AlphaFold, включают:
Биологическая головоломка, выбранная Кэтрин Туньясувунакул
В недавнем специальный выпуск журнала ScienceНесколько групп описали, как AlphaFold помог им собрать воедино комплекс ядерных пор, одну из самых жестоких загадок в биологии. Гигантская структура состоит из сотен белковых частей и контролирует все, что входит и выходит из ядра клетки. Его тонкая структура была наконец раскрыта с помощью существующих экспериментальных методов для выявления его контуров и предсказаний AlphaFold для завершения и интерпретации любых неясных областей. Эта мощная комбинация теперь становится обычным явлением в лабораториях, открывая новые научные возможности и показывая, как экспериментальные и вычислительные методы могут работать вместе.
Новый мир биоинформатики, выбранный Ричардом Эвансом
Инструменты структурного поиска, такие как Фолдсик и Дали позволяют пользователям очень быстро искать записи, похожие на данный белок. Это может стать первым шагом на пути к поиску больших наборов данных о последовательностях практически полезных белков, например, тех, которые расщепляют пластик, и может дать представление о функции белков. Обновление базы данных, включающее более 200 миллионов предсказанных структур, еще больше усилит это влияние.
Прямое влияние на здоровье человека, выбор Джона Джампера
AlphaFold уже оказывает значительное и прямое влияние на здоровье человека. Встреча с исследователями в Европейское общество генетики человека показало, насколько важны структуры AlphaFold для биологов и клиницистов, пытающихся разгадать причины редких генетических заболеваний. Кроме того, AlphaFold ускорение открытия лекарств обеспечивая лучшее понимание недавно идентифицированных белков, которые могут быть мишенью для лекарств, и помогая ученым быстрее находить потенциальные лекарства, которые с ними связываются.
Только начало
AlphaFold открыла для биологии эпоху структурного изобилия, открыв путь научным исследованиям на цифровой скорости. AlphaFold DB служит «поиском в Google» белковых структур, предоставляя исследователям мгновенный доступ к предсказанным моделям белков, которые они изучают, что позволяет им сосредоточить свои усилия и ускорить экспериментальную работу. От борьба с болезнью к разработка вакцинAlphaFold уже добилась невероятных успехов в решении некоторых из наших крупнейших глобальных задач, и это только начало того эффекта, который мы начнем видеть в ближайшие несколько лет. Мы надеемся, что эта расширенная база данных поможет бесчисленному количеству ученых в их работе и откроет совершенно новые направления научных исследований, такие как метапротеомика.
В DeepMind мы усердно работаем над развитием всего этого потенциала, вкладывая значительные инвестиции во многие области, включая партнерство с нашей новой дочерней компанией Alphabet. Изоморфные лаборатории переосмыслить весь процесс открытия лекарств, взяв за основу принципы, основанные на искусственном интеллекте; создание мокрой лаборатории в знаменитом Институт Фрэнсиса Крика укрепить связь между ИИ и экспериментальными методами для углубления понимания биологии, включая дизайн белков и геномику; и расширяем нашу ИИ для науки команде, чтобы ускорить дальнейший прогресс в наших фундаментальных биологических исследованиях и применить ИИ для решения других интересных и важных научных задач, таких как наука о климате, квантовая химияи слияние.
AlphaFold — это взгляд в будущее и на то, что может быть возможно с помощью вычислительных методов и методов искусственного интеллекта, применяемых в биологии. На самом фундаментальном уровне биологию можно рассматривать как систему обработки информации, хотя и чрезвычайно сложную и развивающуюся. Точно так же, как математика является идеальным языком описания физики, мы считаем, что ИИ может оказаться именно тем методом, который поможет справиться с динамической сложностью биологии. AlphaFold — важное первое доказательство этого и знак того, что нас ждет гораздо больше. Как пионеры в развивающейся области «цифровой биологии», мы рады видеть, что огромный потенциал ИИ начинает реализовываться как один из самых полезных инструментов человечества для продвижения научных открытий и понимания фундаментальных механизмов жизни.