заглушки DeepMind готов преобразовать биологические науки, решив проблему сворачивания белков - Unite.AI
Свяжитесь с нами:

Artificial Intelligence

DeepMind готов преобразовать биологические науки, решив проблему сворачивания белков

mm
обновленный on

Подразделение Google по искусственному интеллекту DeepMind недавно добился значительного прогресса на пути к решению одной из старейших задач биологии, рассчитывая форму белка по аминокислотной последовательности. Согласно Nature, прорыв может изменить области биологии и химии, позволяя ученым определить функцию многих белков, которые в настоящее время остаются загадочными.

Форма белка определяет его функцию, и большинство биологических функций зависят от белков. «Свертывание белков» так называется процесс преобразования цепочек аминокислот в трехмерные структуры, необходимые протионам для выполнения своих функций. Если ученые смогут определить взаимосвязь между последовательностями аминокислот и формой белков, которые они генерируют, они смогут определить, какие белки влияют на различные биологические процессы.

Ученые предполагают, что в протеоме человека содержится не менее 80,000 XNUMX белков, но лишь небольшая часть этих белков имеет известную структуру. Традиционный метод определения формы белка может занять годы лабораторных экспериментов, даже используя мощь алгоритмов и моделей компьютерных наук. Работа, проделанная DeepMind, может значительно ускорить процесс обнаружения белковых структур, надежно определяя структуру белков за долю обычного времени.

Исследователи DeepMind обучали свои алгоритмы работе с базой данных, состоящей примерно из 170,0000 100 белковых последовательностей и форм, соответствующих этим последовательностям. Алгоритмы, разработанные исследователями, были обучены на от 200 до XNUMX графических процессоров, и процесс обучения занял несколько недель. Модель, разработанная исследователями, получила название AlphaFold.

AlphaFold работает с помощью «алгоритма натяжения», начиная с соединения небольших кусочков белка, а затем увеличивая их, чтобы соединить все более и более крупные участки. Сначала были связаны небольшие кластеры аминокислот, а затем алгоритм искал способы связать эти кластеры.

Исследователи AlphaFold изначально пытались использовать обычные алгоритмы глубокого обучения на генетических и структурных данных, чтобы предсказать взаимосвязь между аминокислотами и белками. Затем AlphaFold создала согласованные модели для стиля белков. Когда оказалось, что этот метод имеет слишком много ограничений, исследователи попробовали новую стратегию. Исследовательская группа AlphaFold создала модели, обученные большему количеству функций, и на этот раз у них была модель, возвращающая прогнозы для окончательной структуры белковых последовательностей.

Команда инженеров провела стресс-тестирование AlphaFold, приняв участие в соревновании, в котором компьютерные алгоритмы соревнуются в оценке структуры белка по аминокислотным последовательностям. Конкурс назывался «Критическая оценка предсказания структуры белка» или CASP. Участникам конкурса предоставляется 100 аминокислотных последовательностей и их модели должны отработать структуру белков. AlphaFold не только превзошла другие компьютерные модели с точки зрения точности, но и сравнима с традиционными лабораторными методами моделирования. Окончательный средний балл AlphaFold составил примерно 92 из 100, при этом лабораторным экспериментальным методам был присвоен балл 90. Медианный балл AlphaFold упал до 87 процентов по наиболее сложным белкам.

По словам генерального директора и соучредителя DeepMind Демиса Хассабиса, компания уже планирует предоставить исследователям доступ к AlphaFold, а ученые из Института биологии развития им. Макса Планка уже используют модель для обнаружения белковых структур, над которыми они работали более десяти лет.

Джанет Торнтон, почетный директор Европейского института биоинформатики, цитируется через ScienceMag заявив, что достижения DeepMind «изменят будущее структурной биологии и исследований белков». Между тем, биолог из Университета Мэриленда, Шейди Гроув, Джон Моулт говорит что он никогда не думал, что проблема свертывания белка никогда не будет решена в этой жизни.

Хотя AlphaFold вряд ли полностью заменит традиционные экспериментальные методы обнаружения белковых структур, он может значительно увеличить скорость обнаружения белковых структур. Исследователям могут потребоваться менее качественные экспериментальные данные для определения структуры белка, и у исследователей уже есть доступ к большому объему геномных данных, которые можно преобразовать в структуры с помощью решений AlphaFold.