Свяжитесь с нами:

ИИ только что смоделировал 500 миллионов лет эволюции — и создал новый белок!

Искусственный интеллект

ИИ только что смоделировал 500 миллионов лет эволюции — и создал новый белок!

mm

Эволюция настраивала жизнь на молекулярном уровне миллиарды лет. Белки, фундаментальные строительные блоки жизни, эволюционировали в ходе этого процесса, чтобы выполнять различные биологические функции, от борьбы с инфекциями до переваривания пищи. Эти сложные молекулы состоят из длинных цепочек аминокислот, организованных в точные последовательности, которые определяют их структуру и функцию. Хотя природа создала необычайное разнообразие белков, понимание их структуры и разработка совершенно новых белков долгое время были сложной задачей для ученых.

Недавние достижения в области искусственного интеллекта трансформируют нашу способность решать некоторые из наиболее важных задач биологии. Ранее ИИ использовался для прогнозирования того, как данная последовательность белка будет складываться и вести себя — сложная задача из-за огромного количества конфигураций. Недавно ИИ продвинулся вперед, чтобы генерировать совершенно новые белки в беспрецедентном масштабе. Эта веха была достигнута с помощью ESM3, мультимодальной генеративной языковой модели, разработанной Эволюционный Масштаб. В отличие от обычных систем ИИ, разработанных для обработки текста, ESM3 обучен понимать последовательности, структуры и функции белков. Что делает его действительно замечательным, так это его способность имитировать 500 миллионов лет эволюции — подвиг, который привел к созданию совершенно нового флуоресцентного белка, никогда ранее не встречавшегося в природе.

Этот прорыв является значительным шагом на пути к тому, чтобы сделать биологию более программируемой, открывая новые возможности для разработки индивидуальных белков с применением в медицине, материаловедении и не только. В этой статье мы рассмотрим, как работает ESM3, чего он достиг и почему это достижение меняет наше понимание биологии и эволюции.

Встречайте ESM3: ИИ, имитирующий эволюцию

ESM3 — это многомодальная языковая модель, обученная понимать и генерировать белки путем анализа их последовательностей, структур и функций. В отличие от AlphaFold, которая может предсказывать структуру существующих белков, ESM3 по сути является моделью белковой инженерии, позволяющей исследователям определять функциональные и структурные требования для проектирования совершенно новых белков.

Модель содержит глубокие знания о последовательностях белков, структурах и функциях, а также способность генерировать белки посредством взаимодействия с пользователями. Эта способность позволяет модели генерировать белки, которые могут не существовать в природе, но оставаться биологически жизнеспособными. Создание нового зеленого флуоресцентного белка (esmGFP) является яркой демонстрацией этой возможности. Флуоресцентные белки, первоначально обнаруженные в медузах и кораллах, широко используются в медицинских исследованиях и биотехнологиях. Для разработки esmGFP исследователи предоставили ESM3 ключевые структурные и функциональные характеристики известных флуоресцентных белков. Затем модель итеративно усовершенствовала дизайн, применив рассуждение по цепочке мыслей подход к оптимизации последовательности. В то время как естественная эволюция может занять миллионы лет для создания подобного белка, ESM3 ускоряет этот процесс, позволяя достичь этого за несколько дней или недель.

Процесс разработки белков с использованием искусственного интеллекта

Вот как исследователи использовали ESM3 для разработки esmGFP:

  1. Побуждая ИИ – Сначала они вводят последовательность и структурные сигналы, чтобы направить ESM3 к функциям, связанным с флуоресценцией.
  2. Создание новых белков – ESM3 исследовал огромное пространство потенциальных последовательностей для получения тысяч кандидатов на белки.
  3. Фильтрация и уточнение – Наиболее перспективные разработки были отфильтрованы и синтезированы для лабораторных испытаний.
  4. Проверка на живых клетках – Выбранные белки, разработанные с помощью ИИ, были экспрессированы в бактериях для подтверждения их флуоресценции и функциональности.

В результате этого процесса был получен флуоресцентный белок (esmGFP), не похожий ни на что в природе.

Сравнение esmGFP с натуральными белками

Что делает esmGFP необычным, так это то, насколько он далек от известных флуоресцентных белков. В то время как большинство недавно обнаруженных GFP имеют небольшие вариации от существующих, esmGFP имеет идентичность последовательности всего на 58% с его ближайшим природным родственником. С эволюционной точки зрения такое различие соответствует расхождению во времени более 500 миллионов лет.

Чтобы представить это в перспективе, в последний раз, когда появились белки с похожими эволюционными расстояниями, динозавры еще не появились, а многоклеточная жизнь все еще находилась на ранних стадиях. Это означает, что ИИ не просто ускорил эволюцию — он смоделировал совершенно новый эволюционный путь, производя белки, которые природа, возможно, никогда не создала бы.

Почему это открытие имеет значение

Эта разработка является значительным шагом вперед в белковой инженерии и углубляет наше понимание эволюции. Моделируя миллионы лет эволюции всего за несколько дней, ИИ открывает двери для новых захватывающих возможностей:

  • Более быстрое открытие лекарств: Многие лекарства работают, воздействуя на определенные белки, но поиск правильных из них — это медленный и дорогой процесс. Разработанные ИИ белки могут ускорить этот процесс, помогая исследователям эффективнее находить новые методы лечения.
  • Новые решения в биоинженерии: Белки используются во всем: от разложения пластиковых отходов до обнаружения заболеваний. С помощью дизайна на основе ИИ ученые могут создавать индивидуальные белки для здравоохранения, защиты окружающей среды и даже новых материалов.
  • ИИ как эволюционный симулятор: Одним из самых интригующих аспектов этого исследования является то, что оно позиционирует ИИ как симулятор эволюции, а не просто инструмент для анализа. Традиционные эволюционные симуляции включают в себя итерацию генетических мутаций, часто требующую месяцев или лет для создания жизнеспособных кандидатов. Однако ESM3 обходит эти медленные ограничения, напрямую предсказывая функциональные белки. Этот сдвиг в подходе означает, что ИИ может не просто имитировать эволюцию, но и активно исследовать эволюционные возможности за пределами природы. При наличии достаточной вычислительной мощности эволюция, управляемая ИИ, может открыть новые биохимические свойства, которые никогда не существовали в естественном мире.

Этические соображения и ответственная разработка ИИ

Хотя потенциальные преимущества белковой инженерии с использованием ИИ огромны, эта технология также поднимает этические и безопасные вопросы. Что происходит, когда ИИ начинает проектировать белки за пределами человеческого понимания? Как мы можем гарантировать, что эти белки безопасны для медицинского или экологического использования?

Нам необходимо сосредоточиться на ответственной разработке ИИ и тщательном тестировании для решения этих проблем. Генерируемые ИИ белки, такие как esmGFP, должны пройти обширные лабораторные испытания, прежде чем рассматриваться для применения в реальном мире. Кроме того, разрабатываются этические рамки для биологии, основанной на ИИ, чтобы обеспечить прозрачность, безопасность и общественное доверие.

Выводы

Запуск ESM3 является жизненно важным достижением в области биотехнологии. ESM3 демонстрирует, что эволюция не должна быть медленным процессом проб и ошибок. Сжатие 500 миллионов лет эволюции белков в считанные дни открывает будущее, в котором ученые могут разрабатывать совершенно новые белки с невероятной скоростью и точностью. Разработка ESM3 означает, что мы можем не только использовать ИИ для понимания биологии, но и для ее изменения. Этот прорыв помогает нам развивать нашу способность программировать биологию так же, как мы программируем программное обеспечение, открывая возможности, которые мы только начинаем себе представлять.

Доктор Техсин Зия — штатный доцент Университета COMSATS в Исламабаде, имеет докторскую степень в области искусственного интеллекта, полученную в Венском технологическом университете, Австрия. Специализируясь на искусственном интеллекте, машинном обучении, науке о данных и компьютерном зрении, он внес значительный вклад, публикуя публикации в авторитетных научных журналах. Доктор Техсин также руководил различными промышленными проектами в качестве главного исследователя и консультанта по искусственному интеллекту.