Новый инструмент искусственного интеллекта классифицирует эффекты 71 миллиона «миссенс» мутаций
Выявление коренных причин заболеваний является одной из величайших задач в генетике человека. Учитывая миллионы возможных мутаций и ограниченность экспериментальных данных, до сих пор остается загадкой, какие из них могут вызвать заболевание. Эти знания имеют решающее значение для более быстрой диагностики и разработки жизненно важных методов лечения.
Сегодня мы выпускаем каталог миссенс-мутаций, где исследователи смогут узнать больше о том, какой эффект они могут иметь. Миссенс-варианты — это генетические мутации, которые могут влиять на функцию белков человека. В некоторых случаях они могут привести к таким заболеваниям, как муковисцидоз, серповидно-клеточная анемия или рак.
Каталог AlphaMissense был разработан с использованием AlphaMissense, нашей новой модели искусственного интеллекта, которая классифицирует варианты миссенс. В статье, опубликованной в Наука, мы показываем, что он классифицировал 89% из всех 71 миллиона возможных миссенс-вариантов как вероятно патогенные или вероятно доброкачественные. Напротив, только 0,1% были подтверждены экспертами-людьми.
Инструменты искусственного интеллекта, которые могут точно предсказать эффект вариантов, способны ускорить исследования в различных областях — от молекулярной биологии до клинической и статистической генетики. Эксперименты по выявлению мутаций, вызывающих заболевания являются дорогостоящими и трудоемкими — каждый белок уникален, и каждый эксперимент приходится планировать отдельно, что может занять месяцы. Используя прогнозы ИИ, исследователи могут получать предварительный просмотр результатов для тысяч белков одновременно, что может помочь расставить приоритеты в ресурсах и ускорить более сложные исследования.
Мы сделали все наши прогнозы бесплатными для исследовательского сообщества и открыли исходные коды. код модели AlphaMissense.
Что такое миссенс-вариант?
Миссенс-вариант — это однобуквенная замена в ДНК, приводящая к образованию другой аминокислоты в белке. Если вы думаете о ДНК как о языке, замена одной буквы может изменить слово и вообще изменить смысл предложения. В этом случае замена меняет аминокислоту, которая транслируется, что может повлиять на функцию белка.
Среднестатистический человек несет более 9000 вариантов миссенса. Большинство из них доброкачественные и практически не оказывают никакого эффекта, но другие являются патогенными и могут серьезно нарушать функцию белка. Миссенс-варианты можно использовать в диагностике редких генетических заболеваний, когда несколько или даже один миссенс-вариант могут непосредственно вызывать заболевание. Они также важны для изучения сложных заболеваний, таких как диабет 2 типа, который может быть вызван сочетанием множества различных типов генетических изменений.
Классификация миссенс-вариантов является важным шагом в понимании того, какие из этих белковых изменений могут привести к заболеванию. Из более чем 4 миллионов миссенс-вариантов, которые уже наблюдались у людей, только 2% были отмечены экспертами как патогенные или доброкачественные, что составляет примерно 0,1% из всех 71 миллиона возможных миссенс-вариантов. Остальные считаются «вариантами неизвестного значения» из-за отсутствия экспериментальных или клинических данных об их влиянии. Благодаря AlphaMissense мы теперь имеем самую четкую картину на сегодняшний день, классифицируя 89% вариантов с использованием порога, который обеспечивает точность 90% в базе данных известных вариантов заболеваний.
Патогенный или доброкачественный: как AlphaMissense классифицирует варианты
AlphaMissense основана на нашей революционной модели AlphaFold, которая предсказала структуры почти всех известных науке белков на основе их аминокислотных последовательностей. Наша адаптированная модель позволяет прогнозировать патогенность миссенс-вариантов, изменяющих отдельные аминокислоты белков.
Чтобы обучить AlphaMissense, мы настроили AlphaFold на метках, различая варианты, наблюдаемые у человека и близкородственных популяций приматов. Часто встречающиеся варианты рассматриваются как доброкачественные, а никогда не встречавшиеся варианты рассматриваются как патогенные. AlphaMissense не прогнозирует изменение структуры белка при мутации или других воздействиях на стабильность белка. Вместо этого он использует базы данных родственных белковых последовательностей и структурного контекста вариантов для получения оценки от 0 до 1, приблизительно оценивающей вероятность того, что вариант является патогенным. Непрерывная оценка позволяет пользователям выбирать порог для классификации вариантов как патогенных или доброкачественных, который соответствует их требованиям к точности.
AlphaMissense обеспечивает самые современные прогнозы по широкому спектру генетических и экспериментальных тестов, и все это без явного обучения на таких данных. Наш инструмент превзошел другие вычислительные методы при использовании для классификации вариантов из ClinVar, общедоступного архива данных о взаимосвязи между человеческими вариантами и болезнями. Наша модель также оказалась наиболее точным методом прогнозирования результатов лабораторных исследований, что показывает, что она согласуется с различными способами измерения патогенности.
Создание ресурса сообщества
AlphaMissense основывается на AlphaFold для дальнейшего понимания белков в мире. Год назад мы опубликовали 200 миллионов белковых структур, предсказанных с помощью AlphaFold, что помогает миллионам ученых по всему миру ускорить исследования и проложить путь к новым открытиям. Мы с нетерпением ждем возможности увидеть, как AlphaMissense может помочь решить открытые вопросы, лежащие в основе геномики и биологической науки.
Мы сделали прогнозы AlphaMissense бесплатными для научного сообщества. Вместе с EMBL-EBI мы также делаем их более удобными для исследователей посредством Предиктор эффекта варианта ансамбля.
В дополнение к нашей справочной таблице миссенс-мутаций мы поделились расширенными прогнозами всех возможных 216 миллионов замен отдельных аминокислотных последовательностей в более чем 19 000 человеческих белках. Мы также включили среднее предсказание для каждого гена, что аналогично измерению эволюционных ограничений гена — оно показывает, насколько важен ген для выживания организма.
Ускорение исследований генетических заболеваний
Ключевым шагом в переводе этого исследования является сотрудничество с научным сообществом. Мы работаем в партнерстве с Genomics England, чтобы выяснить, как эти прогнозы могут помочь в изучении генетики редких заболеваний. Отделение Genomics England сопоставило результаты AlphaMissense с данными о патогенности вариантов, ранее агрегированными с участием людей. Их оценка подтвердила, что наши прогнозы точны и последовательны, что стало еще одним реальным эталоном для AlphaMissense.
Хотя наши прогнозы не предназначены для непосредственного использования в клинике – и их следует интерпретировать с учетом других источников доказательств – эта работа потенциально может улучшить диагностику редких генетических нарушений и помочь обнаружить новые гены, вызывающие заболевания.
В конечном итоге мы надеемся, что AlphaMissense вместе с другими инструментами позволит исследователям лучше понять болезни и разработать новые методы лечения, спасающие жизни.
Узнайте больше об AlphaMissense: