В июле 2022 года мы опубликовали прогнозы структуры белка AlphaFold почти для всех известных науке каталогизированных белков. Читать последний блог здесь.
Сегодня я невероятно горд и взволнован, чтобы объявить, что DeepMind вносит значительный вклад в понимание человечеством биологии.
Когда мы анонсирована AlphaFold 2 В декабре прошлого года его приветствовали как решение 50-летней проблемы свертывания белка. На прошлой неделе мы опубликовали научная бумага и исходный код объясняя, как мы создали эту инновационную систему, и сегодня мы делимся качественные прогнозы для формы каждого отдельного белка в организме человека, а также для белков 20 дополнительных организмов, на которые ученые полагаются в своих исследованиях.
По мере того, как исследователи ищут лекарства от болезней и ищут решения других серьезных проблем, стоящих перед человечеством, включая устойчивость к антибиотикам, загрязнение микропластиком и изменение климата, им будет полезно новое понимание структуры белков. Белки подобны крошечным изысканным биологическим машинам. Точно так же, как структура машины говорит вам, что она делает, так и структура белка помогает нам понять его функцию. Сегодня мы делимся кладезь информации что удваивает понимание человечеством человеческого протеомаи раскрывает белковые структуры, обнаруженные в 20 других биологически значимых организмах, от кишечной палочки до дрожжей и от плодовой мухи до мыши.
Это будет один из самых важных наборов данных с момента картирования генома человека.
Эван Бирни, заместитель генерального директора EMBL и директор EMBL-EBI
Как мощный инструмент, который поддерживает усилия исследователей, мы считаем, что это самый значительный вклад ИИ в развитие научных знаний на сегодняшний день и отличный пример преимуществ, которые ИИ может принести человечеству. Эти идеи будут лежать в основе многих захватывающих будущих достижений в нашем понимании биологии и медицины. Благодаря пяти годам неустанной работы и большой изобретательности команды AlphaFold, а также тесному сотрудничеству в течение последних нескольких месяцев с нашими партнерами в Европейский институт биоинформатики EMBL (EMBL-EBI)мы можем поделиться этим огромным и ценным ресурсом с миром.
Эта последняя работа основана на объявления мы сделали в декабре прошлого года на конференции CASP14, когда DeepMind представила радикально новую версию нашей системы AlphaFold, которая была признана организаторами оценки решением 50-летней грандиозной задачи по пониманию трехмерной структуры белков. Экспериментальное определение белковых структур — это трудоемкая и кропотливая работа, но AlphaFold продемонстрировала, что ИИ может точно предсказывать форму белка в масштабе и за минуты с точностью до атома. В КАСПмы обязались поделиться нашими методами и предоставить широкий доступ к этой совокупности знаний.
В этом месяце мы завершили огромный объем тяжелой работы, чтобы выполнить это обязательство. Мы опубликовали две рецензируемые статьи в Природа (1,2) и код AlphaFold с открытым исходным кодом. Сегодня в партнерстве с ЭМБЛ-ЭБИмы невероятно гордимся тем, что запускаем База данных структуры белка AlphaFoldкоторый предлагает наиболее полную и точную картину протеома человека на сегодняшний день, более чем вдвое увеличивая накопленные человечеством знания о высокоточных структурах белков человека.
В дополнение к протеому человека (все ~20 000 белков, экспрессируемых геномом человека), мы предоставляем открытый доступ к протеомам 20 других биологически значимых организмов, всего более 350 000 белковых структур. Исследования этих организмов были предметом бесчисленных исследовательских работ и многочисленных крупных прорывов и привели к более глубокому пониманию самой жизни. В ближайшие месяцы мы планируем значительно расширить охват почти каждому секвенированному белку, известному науке – более 100 миллионов структур, покрывающих большую часть Справочная база данных ЮниПрот. Это настоящий белковый альманах мира. И система, и база данных будут периодически обновляться, поскольку мы продолжаем вкладывать средства в будущие усовершенствования AlphaFold.
Самое интересное, что в руках ученых всего мира этот новый белковый альманах позволит и ускорит исследования, которые улучшат наше понимание этих строительных блоков жизни. Уже в ходе нашего раннего сотрудничества мы видели многообещающие сигналы от исследователей, использующих AlphaFold в своей работе. Например, Инициатива «Лекарства от забытых болезней» (DNDi) продвинули свои исследования в области спасения жизни для болезней, которые непропорционально затрагивают более бедные части мира, и Центр ферментных инноваций в Университете Портсмута (CEI) использует AlphaFold, чтобы помочь разработать более быстрые ферменты для переработки некоторых из наших самых загрязняющих одноразовых пластиков. Тем ученым, которые полагаются на экспериментальное определение структуры белка, прогнозы AlphaFold помогли ускорить их исследования. В качестве другого примера, команда в Университет Колорадо в Боулдере находит многообещающим использование прогнозов AlphaFold для изучения устойчивости к антибиотикам, в то время как группа в Калифорнийский университет в Сан-Франциско использовал их для улучшить свое понимание биологии SARS-CoV-2. И это только начало того, что, как мы надеемся, станет революцией в структурной биоинформатике. С появлением AlphaFold в мире существует кладезь данных, ожидающих превращения в будущие достижения.
AlphaFold открывает новые горизонты исследований, и нас вдохновляет видеть, как мощный передовой ИИ позволяет работать с болезнями, которые сосредоточены почти исключительно в бедных слоях населения.
– Бен Перри, лидер открытых инноваций Discovery, Инициатива «Лекарства от забытых болезней» (DNDi)
Для команды AlphaFold в DeepMind эта работа представляет собой кульминацию пяти лет огромных усилий, в том числе необходимости творчески преодолевать множество сложных неудач, что привело к множеству новых сложных алгоритмических инноваций, которые были необходимы для окончательного решения проблемы. Он основан на открытиях поколений ученых, от первых пионеров белковой визуализации и кристаллографии до тысяч специалистов по прогнозированию и структурных биологов, которые с тех пор провели годы, экспериментируя с белками. Мы мечтаем о том, чтобы AlphaFold, предоставляя это фундаментальное понимание, помогла бесчисленному количеству ученых в их работе и открыла бы совершенно новые возможности для научных открытий.
То, на что у нас уходили месяцы и годы, AlphaFold смогла сделать за выходные.
– Профессор Джон МакГихан, профессор структурной биологии и директор Центра инноваций в области ферментов (CEI) Портсмутского университета.
В DeepMind наш тезис всегда заключался в том, что искусственный интеллект может значительно ускорить прорывы во многих областях науки и, в свою очередь, продвинуть вперед человечество. Мы построили АльфаФолд и База данных структуры белков AlphaFold поддерживать и поощрять усилия ученых всего мира в важной работе, которую они выполняют. Мы считаем, что искусственный интеллект может революционизировать науку в 21 веке, и мы с нетерпением ждем открытий, которые AlphaFold может помочь научному сообществу открыть в будущем.
Чтобы узнать больше, зайдите на сайт Nature, чтобы прочитать наши рецензируемые статьи, описывающие наши полный методи протеом человека. Подробнее о них вы можете прочитать в нашей технический блог. Если вы хотите изучить нашу систему, вот открытый исходный код для AlphaFold и Блокнот Colab для запуска отдельных последовательностей. Чтобы изучить наши структуры, EMBL-EBI, мировой лидер в области биологических данных, размещает их в база данных с возможностью поиска это открыто и бесплатно для всех.
Мы хотели бы услышать ваши отзывы и понять, насколько AlphaFold был полезен в вашем исследовании. Поделитесь своими историями на alphafold@deepmind.com.