Искусственный интеллект

Evogene и Google Cloud представляют фундаментальную модель для генеративного проектирования молекул, открывая новую эру в области ИИ в биотехнологиях

mm

Evogene Ltd. представила первую в своем классе генеративную модель ИИ для проектирования малых молекул, что стало прорывом в открытии новых соединений. Объявлено 10 июня 2025 года в сотрудничестве с Google Cloud, модель расширяет платформу ChemPass AI и решает давнюю проблему в области фармацевтики и сельского хозяйства: поиск новых молекул, удовлетворяющих нескольким сложным критериям одновременно. Это развитие должно ускорить исследования и разработки в области открытия лекарств и защиты культур, позволяя одновременно оптимизировать свойства, такие как эффективность, токсичность и стабильность, в одном цикле проектирования.

От последовательного скрининга к одновременному проектированию

В традиционных исследованиях в области лекарств и сельскохозяйственной химии ученые обычно тестируют один фактор за раз – сначала проверяют, работает ли соединение, а затем тестируют на безопасность и стабильность. Этот пошаговый метод медленный, дорогой и часто заканчивается неудачей, когда многие перспективные соединения не удовлетворяют требованиям на более поздних этапах. Он также заставляет исследователей сосредотачиваться на известных химических структурах, ограничивая инновации и делая более трудным создание новых, патентных продуктов. Этот устаревший подход способствует высоким затратам, долгим срокам и низкому проценту успеха – около 90% кандидатов на лекарства терпят неудачу до того, как они попадают на рынок.

Генеративный ИИ меняет эту парадигму. Вместо пошаговой фильтрации модели ИИ могут одновременно учитывать несколько требований, проектируя молекулы, которые являются эффективными, безопасными и стабильными с самого начала. Новая фундаментальная модель Evogene была явно разработана для того, чтобы ermöglicht одновременное многопараметрическое проектирование. Этот подход направлен на снижение рисков на более поздних этапах разработки, включая такие факторы, как ADME и токсичность, в начальном проектировании.

На практике это может означать меньше поздних неудач – например, меньше кандидатов на лекарства, которые показывают хорошие результаты в лабораторных испытаниях, но терпят неудачу в клинических испытаниях из-за побочных эффектов. Вкратце, генеративный ИИ позволяет исследователям инновировать быстрее и умнее, одновременно оптимизируя многие аспекты успешной молекулы, а не решая каждую проблему изолированно.

Внутри ChemPass AI: Как генеративные модели проектируют молекулы

В основе платформы ChemPass AI лежит мощная новая фундаментальная модель, обученная на огромной химической базе данных. Компания собрала кураторскую базу данных примерно 40 миллиардов молекулярных структур – включая известные лекарственные соединения и разнообразные химические каркасы – чтобы научить ИИ “языку” молекул. Используя инфраструктуру Vertex AI от Google Cloud с суперкомпьютерами на основе GPU, модель выучила закономерности из этой огромной химической библиотеки, дав ей беспрецедентную широту знаний о том, как выглядят лекарственные молекулы. Это массивная тренировочная программа аналогична тренировке большой языковой модели, но вместо человеческого языка ИИ выучил химические представления.

Генеративная модель Evogene построена на архитектуре трансформерных нейронных сетей, подобной моделям GPT, которые революционизировали обработку естественного языка. На самом деле, система называется ChemPass-GPT, проприетарной моделью ИИ, обученной на строках SMILES (текстовом представлении молекулярных структур). В простых терминах ChemPass-GPT рассматривает молекулы как предложения – каждая молекула представлена строкой SMILES, которая является последовательностью символов, описывающих ее атомы и связи. Трансформерная модель выучила грамматику этого химического языка, позволяя ей “писать” новые молекулы, предсказывая один символ за раз, как и GPT может писать предложения буква за буквой. Поскольку она была обучена на миллиардах примеров, модель может генерировать новые строки SMILES, соответствующие химически действительным, лекарственным структурам.

Этот последовательный генеративный подход использует силу трансформеров в захвате сложных закономерностей. Обучаясь на такой огромной и химически разнообразной базе данных, ChemPass AI преодолевает проблемы, с которыми столкнулись более ранние модели ИИ, такие как предвзятость из-за небольших баз данных или генерация избыточных или недействительных молекул. Фундаментальная модель уже намного превосходит традиционную модель GPT, примененную к химии: внутренние испытания показали примерно 90% точности в производстве новых молекул, удовлетворяющих всем критериям проектирования, по сравнению с ~29% точности для традиционной модели GPT. В практическом смысле это означает, что почти все молекулы, предложенные ChemPass AI, не только новые, но и удовлетворяют целевому профилю, что является поразительным улучшением по сравнению с базовыми генеративными методами.

Хотя основной генеративный движок Evogene использует трансформер на линейных строках SMILES, стоит отметить, что более широкий инструментарий ИИ включает другие архитектуры, такие как графовые нейронные сети (GNN). Молекулы естественно представлены в виде графов – с атомами в качестве узлов и связями в качестве ребер – и GNN могут直接 рассуждать об этих структурах. В современном проектировании лекарств GNN часто используются для прогнозирования свойств или даже генерации молекул путем построения их атом за атомом. Этот графический подход дополняет последовательные модели; например, платформа Evogene также включает инструменты, такие как DeepDock для 3D виртуального скрининга, который, вероятно, использует глубокое обучение для оценки связывания молекул в контексте структуры. Объединяя последовательные модели (хорошие для творчества и новизны) с графическими моделями (хорошими для структурной точности и прогнозирования свойств), ChemPass AI обеспечивает, что сгенерированные соединения не только новые на бумаге, но и химически обоснованные и эффективные на практике. Цикл проектирования ИИ может генерировать кандидатные структуры и затем оценивать их с помощью прогностических моделей – некоторые, возможно, основанные на GNN – для критериев, таких как токсичность или синтетическая осуществимость, создавая цикл обратной связи, который уточняет каждое предложение.

Многокритериальная оптимизация: Эффективность, токсичность, стабильность все одновременно

Одной из выдающихся особенностей ChemPass AI является ее встроенная возможность многокритериальной оптимизации. Классическое открытие лекарств часто оптимизирует одно свойство за раз, но ChemPass AI была разработана для одновременного решения нескольких задач. Это достигается с помощью продвинутых методов машинного обучения, которые направляют генеративную модель на удовлетворение нескольких ограничений. В процессе обучения Evogene может задавать требования к свойствам – такие как молекула должна активировать определенную мишень сильно, избегать определенных токсичных мотивов и иметь хорошую биодоступность – и модель учится ориентироваться в химическом пространстве под этими правилами. Система ChemPass-GPT даже позволяет “генерацию на основе ограничений”, то есть она может быть инструктирована предлагать только молекулы, удовлетворяющие определенным желаемым свойствам с самого начала.

Как ИИ выполняет этот баланс нескольких параметров? Одним из подходов является многозадачное обучение, при котором модель не только генерирует молекулы, но и прогнозирует их свойства с помощью обученных прогностиков, регулируя генерацию соответственно. Другим мощным подходом является обучение с подкреплением (RL). В рабочем процессе, усиленном RL, генеративная модель действует как “агент”, “играющий в игру” проектирования молекул: она предлагает молекулу и затем получает оценку вознаграждения на основе того, насколько хорошо эта молекула удовлетворяет задачам (эффективность, отсутствие токсичности и т. д.). После многих итераций модель корректирует свою стратегию генерации, чтобы максимизировать это вознаграждение. Этот метод был успешно использован в других системах проектирования лекарств на основе ИИ – исследователи показали, что алгоритмы обучения с подкреплением могут направлять генеративные модели на производство молекул с желаемыми свойствами. По сути, ИИ может быть обучен функцией вознаграждения, которая включает в себя несколько целей, например, начисляя баллы за прогнозируемую эффективность и вычитая баллы за прогнозируемую токсичность. Модель затем оптимизирует свои “ходы” (добавление или удаление атомов, изменение функциональных групп), чтобы получить максимальный балл, эффективно изучая компромиссы, необходимые для удовлетворения всех критериев.

Evogene не раскрыла точную проприетарную основу многокритериального двигателя ChemPass AI, но rõчно из их результатов, что такие стратегии действуют. Факт, что каждое сгенерированное соединение “одновременно удовлетворяет основным параметрам” как эффективность, синтезируемость и безопасность. Ближайшая версия ChemPass AI 2.0 будет еще дальше – она разрабатывается для того, чтобы позволить еще более гибкую настройку нескольких параметров, включая пользовательские критерии, адаптированные к конкретным терапевтическим областям или требованиям культур. Это предполагает, что следующая модель может позволить исследователям регулировать важность определенных факторов (например, приоритизируя проникновение в мозг для нейрологического препарата или экологическую биоразлагаемость для пестицида) и ИИ будет корректировать свою стратегию проектирования соответственно. Интегрируя такие многокритериальные возможности, ChemPass AI может проектировать молекулы, которые удовлетворяют оптимальным показателям на нескольких параметрах одновременно, что практически невозможно с помощью традиционных методов.

Прыжок за пределы традиционных методов исследования и разработок

Появление генеративной модели ChemPass AI подчеркивает более широкий сдвиг в исследованиях и разработках в области биотехнологий: переход от трудоемких методов проб и ошибок к ИИ-усиленному творчеству и точности. В отличие от человеческих химиков, которые склонны придерживаться известных химических рядов и итеративно совершенствовать их, ИИ может осмыслить миллиарды возможностей и войти в неисследованное 99,9% химического пространства. Это открывает дверь к открытию эффективных соединений, которые не похожи на все, что мы видели раньше – что крайне важно для лечения заболеваний с новой химией или борьбы с вредителями и патогенами, которые развили резистентность к существующим молекулам. Кроме того, учитывая патентоспособность с самого начала, генеративный ИИ помогает избежать загруженных областей интеллектуальной собственности. Evogene явно стремится производить молекулы, которые создают новые патенты, что является важным конкурентным преимуществом.

Преимущества над традиционными подходами можно суммировать следующим образом:

  • Параллельная многопараметрическая оптимизация: ИИ оценивает несколько параметров параллельно, проектируя молекулы, которые удовлетворяют эффективности, безопасности и другим критериям. Традиционные трубопроводы, в отличие от этого, часто обнаруживают проблему токсичности только после лет работы над перспективным препаратом. Предварительно фильтруя такие проблемы, кандидаты, спроектированные ИИ, имеют лучший шанс на успех в дорогостоящих поздних испытаниях.

  • Расширение химического разнообразия: Генеративные модели не ограничены существующими библиотеками соединений. ChemPass AI может создавать структуры, которые никогда не были синтезированы раньше, но предсказываются как эффективные. Этот новизна-ориентированный генеративный подход избегает повторного изобретения колеса (или молекулы) и помогает создавать дифференцированные продукты с новыми механизмами действия. Традиционные методы часто приводят к “аналогичным” соединениям, которые предлагают мало новизны.

  • Скорость и масштаб: То, что команда химиков могла бы достичь с помощью синтеза и тестирования за год, ИИ может смоделировать за несколько дней. Платформа ChemPass AI на основе глубокого обучения может быстро виртуально скринить десятки миллиардов соединений и генерировать сотни новых идей в одном запуске. Это значительно сжимает сроки открытия, сосредотачивая лабораторные эксперименты только на самых перспективных кандидатах, выявленных в silico.

  • Интегрированные знания: Модели ИИ, такие как ChemPass, включают огромное количество химических и биологических знаний (например, известные структура-активность отношения, предупреждения о токсичности, правила лекарственных свойств) в процессе обучения. Это означает, что каждое проектирование молекулы пользуется широким спектром предыдущих данных, которые ни один человеческий эксперт не мог бы удержать в памяти. Традиционное проектирование полагается на опыт медико-химиков – ценный, но ограниченный человеческой памятью и предвзятостью – тогда как ИИ может захватить закономерности в миллионах экспериментов и различных химических семейств.

В практическом смысле для фармацевтики это может привести к более высоким показателям успеха в клинических испытаниях и снижению затрат на разработку, поскольку меньше ресурсов тратится на обреченные соединения. В сельском хозяйстве это означает более быстрое создание безопасных и устойчивых средств защиты культур – например, гербицида, который смертелен для сорняков, но безвреден для нецелевых организмов и разлагается безвредно в окружающей среде. Оптимизируя эффективность и экологическую безопасность вместе, ИИ может помочь создать “эффективные, устойчивые и патентные” агрохимикаты, решая регуляторные и резистентные проблемы одновременно.

Часть более широкого инструментария ИИ в Evogene

Хотя ChemPass AI привлекает внимание за проектирование малых молекул, она является частью трио ИИ-инструментов Evogene, адаптированных для различных областей. Компания имеет MicroBoost AI для микробов, ChemPass AI для химии и GeneRator AI для генетических элементов. Каждый двигатель применяет большие данные и машинное обучение к своей области.

Этот интегрированный экосистемы ИИ-инструментов подчеркивает стратегию Evogene как “ИИ-первой” биотехнологической компании. Они стремятся революционизировать открытие продуктов во всех областях – будь то разработка лекарства, биостимулятора или засухоустойчивой культуры – с помощью вычислительных методов для навигации в биологической сложности. Двигатели имеют общую философию: использовать передовые методы машинного обучения для увеличения вероятности успеха в исследованиях и разработках и снижения времени и затрат.

Перспектива: ИИ-управляемое открытие созревает

Генеративный ИИ преобразует открытие молекул, смещая роль ИИ от помощника к творческому сотруднику. Вместо тестирования одной идеи за раз ученые могут теперь использовать ИИ для проектирования совершенно новых соединений, удовлетворяющих нескольким целям – эффективности, безопасности, стабильности и т. д. – в одном шаге.

Это будущее уже разворачивается. Фармацевтическая команда может запросить молекулу, нацеленную на конкретный белок, избегающую мозга и доступную перорально – ИИ может предоставить кандидаты по требованию. В сельском хозяйстве исследователи могли бы генерировать экологически чистые средства борьбы с вредителями, адаптированные к регуляторным и экологическим ограничениям.

Недавняя фундаментальная модель Evogene, разработанная с Google Cloud, является примером этого сдвига. Она позволяет многопараметрическому проектированию и открывает новые области химического пространства. По мере того, как будущие версии позволят еще большую настройку, эти модели станут необходимыми инструментами во всех биотехнологиях.

Критически важно, что влияние зависит от реальной проверки. По мере того, как молекулы, сгенерированные ИИ, тестируются и совершенствуются, модели улучшаются – создавая мощный цикл обратной связи между вычислениями и экспериментами.

Этот генеративный подход не ограничивается лекарствами или пестицидами. Он может вскоре привести к прорывам в материалах, пище и устойчивости – предлагая более быстрое и умное открытие во всех отраслях, ранее ограниченных пробами и ошибками.

Антуан - видный лидер и сооснователь Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Как серийный предприниматель, он считает, что ИИ будет столь же разрушительным для общества, как электричество, и часто увлекается потенциалом разрушительных технологий и ИИ.

Как футуролог, он посвящен изучению того, как эти инновации изменят наш мир. Кроме того, он является основателем Securities.io, платформы, ориентированной на инвестиции в передовые технологии, которые переопределяют будущее и меняют целые сектора.