Исследовать
Новый инструмент искусственного интеллекта классифицирует эффекты 71 миллиона «миссенс» мутаций
Выявление коренных причин заболеваний является одной из величайших задач в генетике человека. Учитывая миллионы возможных мутаций и ограниченность экспериментальных данных, до сих пор остается загадкой, какие из них могут вызвать заболевание. Эти знания имеют решающее значение для более быстрой диагностики и разработки жизненно важных методов лечения.
Сегодня мы выпускаем каталог миссенс-мутаций, где исследователи смогут узнать больше о том, какой эффект они могут иметь. Миссенс-варианты — это генетические мутации, которые могут влиять на функцию белков человека. В некоторых случаях они могут привести к таким заболеваниям, как муковисцидоз, серповидно-клеточная анемия или рак.
Каталог AlphaMissense был разработан с использованием AlphaMissense, нашей новой модели искусственного интеллекта, которая классифицирует варианты миссенс. В статье, опубликованной в Наука, мы показываем, что он классифицировал 89% из всех 71 миллиона возможных миссенс-вариантов как вероятно патогенные или вероятно доброкачественные. Напротив, только 0,1% были подтверждены экспертами-людьми.
Инструменты искусственного интеллекта, которые могут точно предсказать эффект вариантов, способны ускорить исследования в различных областях — от молекулярной биологии до клинической и статистической генетики. Эксперименты по выявлению мутаций, вызывающих заболевания являются дорогостоящими и трудоемкими — каждый белок уникален, и каждый эксперимент приходится планировать отдельно, что может занять месяцы. Используя прогнозы ИИ, исследователи могут получать предварительный просмотр результатов для тысяч белков одновременно, что может помочь расставить приоритеты в ресурсах и ускорить более сложные исследования.
Мы сделали все наши прогнозы бесплатными для исследовательского сообщества и открыли исходные коды. код модели AlphaMissense.
Что такое миссенс-вариант?
Миссенс-вариант — это однобуквенная замена в ДНК, приводящая к образованию другой аминокислоты в белке. Если вы думаете о ДНК как о языке, замена одной буквы может изменить слово и вообще изменить смысл предложения. В этом случае замена меняет аминокислоту, которая транслируется, что может повлиять на функцию белка.
Среднестатистический человек несет более 9000 вариантов миссенса. Большинство из них доброкачественные и практически не оказывают никакого эффекта, но другие являются патогенными и могут серьезно нарушать функцию белка. Миссенс-варианты можно использовать в диагностике редких генетических заболеваний, когда несколько или даже один миссенс-вариант могут непосредственно вызывать заболевание. Они также важны для изучения сложных заболеваний, таких как диабет 2 типа, который может быть вызван сочетанием множества различных типов генетических изменений.
Классификация миссенс-вариантов является важным шагом в понимании того, какие из этих белковых изменений могут привести к заболеванию. Из более чем 4 миллионов миссенс-вариантов, которые уже наблюдались у людей, только 2% были отмечены экспертами как патогенные или доброкачественные, что составляет примерно 0,1% из всех 71 миллиона возможных миссенс-вариантов. Остальные считаются «вариантами неизвестного значения» из-за отсутствия экспериментальных или клинических данных об их влиянии. Благодаря AlphaMissense мы теперь имеем самую четкую картину на сегодняшний день, классифицируя 89% вариантов с использованием порога, который обеспечивает точность 90% в базе данных известных вариантов заболеваний.
Патогенный или доброкачественный: как AlphaMissense классифицирует варианты
AlphaMissense основана на нашей революционной модели. АльфаФолд, которые предсказали структуры почти всех известных науке белков по их аминокислотным последовательностям. Наша адаптированная модель позволяет прогнозировать патогенность миссенс-вариантов, изменяющих отдельные аминокислоты белков.
Чтобы обучить AlphaMissense, мы настроили AlphaFold на метках, различая варианты, наблюдаемые у человека и близкородственных популяций приматов. Часто встречающиеся варианты рассматриваются как доброкачественные, а никогда не встречавшиеся варианты рассматриваются как патогенные. AlphaMissense не прогнозирует изменение структуры белка при мутации или других воздействиях на стабильность белка. Вместо этого он использует базы данных родственных белковых последовательностей и структурного контекста вариантов для получения оценки от 0 до 1, приблизительно оценивающей вероятность того, что вариант является патогенным. Непрерывная оценка позволяет пользователям выбирать порог для классификации вариантов как патогенных или доброкачественных, который соответствует их требованиям к точности.
AlphaMissense обеспечивает самые современные прогнозы по широкому спектру генетических и экспериментальных тестов, и все это без явного обучения на таких данных. Наш инструмент превзошел другие вычислительные методы при использовании для классификации вариантов из ClinVar, общедоступного архива данных о взаимосвязи между человеческими вариантами и болезнями. Наша модель также оказалась наиболее точным методом прогнозирования результатов лабораторных исследований, что показывает, что она согласуется с различными способами измерения патогенности.
Создание ресурса сообщества
AlphaMissense основывается на AlphaFold для дальнейшего понимания белков в мире. Год назад мы выпустили 200 миллионов белковых структур предсказано с помощью AlphaFold, которое помогает миллионам ученых по всему миру ускорить исследования и проложить путь к новым открытиям. Мы с нетерпением ждем возможности увидеть, как AlphaMissense может помочь решить открытые вопросы, лежащие в основе геномики и биологической науки.
Мы сделали прогнозы AlphaMissense бесплатными для научного сообщества. Вместе с EMBL-EBI мы также делаем их более удобными для исследователей посредством Предиктор эффекта варианта ансамбля.
В дополнение к нашей справочной таблице миссенс-мутаций мы поделились расширенными прогнозами всех возможных 216 миллионов замен отдельных аминокислотных последовательностей в более чем 19 000 человеческих белках. Мы также включили среднее предсказание для каждого гена, что аналогично измерению эволюционных ограничений гена — оно показывает, насколько важен ген для выживания организма.
Ускорение исследований генетических заболеваний
Ключевым шагом в переводе этого исследования является сотрудничество с научным сообществом. Мы работаем в партнерстве с Genomics England, чтобы выяснить, как эти прогнозы могут помочь в изучении генетики редких заболеваний. Отделение Genomics England сопоставило результаты AlphaMissense с данными о патогенности вариантов, ранее агрегированными с участием людей. Их оценка подтвердила, что наши прогнозы точны и последовательны, что стало еще одним реальным эталоном для AlphaMissense.
Хотя наши прогнозы не предназначены для непосредственного использования в клинике – и их следует интерпретировать с учетом других источников доказательств – эта работа потенциально может улучшить диагностику редких генетических нарушений и помочь обнаружить новые гены, вызывающие заболевания.
В конечном итоге мы надеемся, что AlphaMissense вместе с другими инструментами позволит исследователям лучше понять болезни и разработать новые методы лечения, спасающие жизни.