Штучний інтелект
Evogene та Google Cloud представляють фундаментальну модель для генеративного дизайну молекул, відкриваючи нову еру в галузі Life-Science AI

Evogene Ltd. представила першу в своєму роді генеративну модель AI для дизайну малих молекул, що означає прорив у відкритті нових сполук. Оголошено 10 червня 2025 року у співпраці з Google Cloud, ця модель розширює платформу ChemPass AI компанії Evogene та вирішує давню проблему у фармацевтиці та сільському господарстві: пошук нових молекул, які одночасно задовольняють кілька складних критеріїв. Цей розвиток має прискорити дослідження та розробку нових лікарських засобів та засобів захисту рослин, дозволяючи одночасно оптимізувати властивості, такі як ефективність, токсичність та стабільність, у одному циклі дизайну.
Від послідовного скринінгу до одночасного дизайну
У традиційних дослідженнях лікарських засобів та хімічних речовин для сільського господарства вчені зазвичай перевіряють один фактор за раз – спочатку перевіряють, чи діє сполука, а потім пізніше перевіряють її безпеку та стабільність. Цей крок за кроком метод є повільним, дорогим і часто закінчується невдачею, оскільки багато перспективних сполук не витримують перевірку на пізніх стадіях. Це також змушує дослідників зосереджуватися на відомих хімічних структурах, що обмежує інновації та ускладнює створення нових, патентованих продуктів. Цей застарілий підхід призводить до високих витрат, тривалих термінів та низького рівня успіху – близько 90% кандидатів на лікарські засоби терплять невдачу до досягнення ринку.
Генеративний AI змінює цю парадигму. Замість послідовного фільтрування моделі AI можуть одночасно обробляти кілька вимог, проектуючи молекули, які одночасно є потужними, безпечними та стабільними. Нова фундаментальна модель Evogene була явно створена для реалізації одночасного багатопараметрового дизайну. Цей підхід спрямований на giảm ризиків на пізніх стадіях розробки шляхом включення до початкового дизайну таких факторів, як ADME та токсичність.
У практиці це може означати менше пізніх невдач – наприклад, менше кандидатів на лікарські засоби, які показують хороші результати у лабораторних умовах, але терплять невдачу у клінічних випробуваннях через побічні ефекти. Загалом, генеративний AI дозволяє дослідникам інновувати швидше та розумніше, одночасно оптимізуючи багато аспектів успішної молекули, а не займаючись кожним окремо.
Всередині ChemPass AI: Як генеративні моделі проектують молекули
У центрі платформи ChemPass AI компанії Evogene знаходиться потужна нова фундаментальна модель, навчена на величезній хімічній базі даних. Компанія зібрала кураторську базу даних з приблизно 40 мільярдів молекулярних структур – відомих лікарських сполук та різноманітних хімічних каркасів – для навчання AI “мові” молекул. Використовуючи інфраструктуру Vertex AI компанії Google Cloud з суперкомп’ютерами GPU, модель вивчила закономірності з цієї величезної хімічної бібліотеки, надавши їй безпрецедентну ширину знань про те, як виглядають лікарські сполуки. Це масштабне навчання аналогічне навчанню великих мовних моделей, але замість людської мови AI вивчила хімічні представлення.
Генеративна модель Evogene побудована на архітектурі трансформерних нейронних мереж, подібній до моделей GPT, які революціонізували обробку природної мови. Насправді, систему називають ChemPass-GPT, власницькою моделлю AI, навченою на рядках SMILES (текстовому кодуванні молекулярних структур). У простих термінах ChemPass-GPT розглядає молекули як речення – кожне речення SMILES є послідовністю символів, які описують атоми та зв’язки молекули. Модель трансформера вивчила граматику цієї хімічної мови, що дозволяє їй “писати” нові молекули шляхом передбачення одного символу за раз, так само, як GPT може писати речення буква за буквою. Через те, що вона була навчена на мільярдах прикладів, модель може генерувати нові рядки SMILES, які відповідають хімічно валідним, лікарським структурам.
Цей послідовний генеративний підхід використовує силу трансформерів у захопленні складних закономірностей. Навчена на такій величезній та хімічно різноманітній базі даних, ChemPass AI вирішує проблеми, з якими раніше зіштовувалися інші моделі AI, такі як упередженість через малі бази даних або генерація надлишкових чи невалідних молекул. Внутрішні тести вже показали про приблизно 90% точності у генерації нових молекул, які задовольняють усі критерії дизайну, у порівнянні з ~29% точністю традиційної моделі GPT.
Хоча основний генеративний двигун Evogene використовує трансформер на лінійних рядках SMILES, варто зазначити, що ширший інструментарій AI включає інші архітектури, такі як графові нейронні мережі (GNN). Молекули природно являють собою графи – з атомами як вузлами та зв’язками як ребрами – і GNN можуть безпосередньо міркувати щодо цих структур. У сучасному дизайні лікарських засобів GNN часто використовуються для передбачення властивостей або навіть генерації молекул шляхом побудови їх атом за атомом. Цей графічний підхід доповнює послідовні моделі; наприклад, платформа Evogene також включає інструменти, такі як DeepDock для віртуального скринінгу 3D, які, ймовірно, використовують глибоке навчання для оцінки зв’язування молекул у контексті, заснованому на структурі. Об’єднуючи послідовні моделі (відмінні для творчості та новизни) з графічними моделями (відмінними для структурної точності та передбачення властивостей), ChemPass AI забезпечує, щоб згенеровані сполуки були не тільки новими на папері, але й хімічно звучними та ефективними на практиці.
Багатоцільова оптимізація: Потужність, токсичність, стабільність всі одночасно
Одна з видатних особливостей ChemPass AI – це її вбудована можливість багаторазової оптимізації. Класичний дизайн лікарських засобів часто оптимізує одну властивість за раз, але ChemPass була розроблена для обробки багатьох об’єктів одночасно. Це досягається за допомогою просунутих технік машинного навчання, які спрямовують генеративну модель до задоволення декількох обмежень. Під час навчання Evogene може накладати вимоги до властивостей – наприклад, молекула повинна активувати певну ціль сильно, уникати певних токсичних мотивів та мати добру біодоступність – і модель вивчає, як орієнтуватися у хімічному просторі під цими правилами. Система ChemPass-GPT навіть дозволяє “генерацію на основі обмежень”, тобто вона може бути інструктована пропонувати лише молекули, які відповідають конкретним бажаним властивостям з самого початку.
Як AI досягає цього багаторазового балансування? Одним з підходів є багатоважне навчання, при якому модель не тільки генерує молекули, але й передбачає їх властивості за допомогою вивчених передбачувачів, регулюючи генерацію відповідно. Іншим потужним підходом є вз зміцнення навчання (RL). У потоці роботи, посиленому RL, генеративна модель діє як агент, який “грає в гру” дизайну молекул: вона пропонує молекулу, а потім отримує оцінку, засновану на тому, наскільки добре ця молекула задовольняє об’єкти (потужність, відсутність токсичності тощо). За багато ітерацій модель коригує свою стратегію генерації для максимізації цієї оцінки. Цей метод був успішно використаний у інших системах дизайну лікарських засобів, керованих AI – дослідники показали, що алгоритми навчання з посиленням можуть спрямовувати генеративні моделі для виробництва молекул з бажаними властивостями. По суті, AI можна тренувати з функцією винагороди, яка охоплює кілька цілей, наприклад, надавати бали за передбачену ефективність та віднімати бали за передбачену токсичність. Модель потім оптимізує свої “ходи” (додавання або видалення атомів, зміну функціональних груп), щоб отримати найвищий бал, ефективно вивчаючи компроміси, необхідні для задоволення всіх критеріїв.
Evogene не розголошує точну власницьку основу багаторазової оптимізації ChemPass AI, але зрозуміло з їх результатів, що такі стратегії діють. Той факт, що кожна згенерована сполука “одночасно задовольняє основні параметри” як ефективність, синтезованість та безпека. Наступна версія ChemPass AI 2.0 буде рухатися далі – вона розробляється для дозволу ще більш гнучкої багаторазової настройки, включаючи користувальницькі критерії, адаптовані до конкретних терапевтичних областей або вимог до культури. Це означає, що наступна модель могла б дозволити дослідникам регулювати важливість певних факторів (наприклад, пріоритету проникнення в мозок для препарату нейрології або біорозкладання для пестициду) та AI буде регулювати свою стратегію дизайну відповідно. Об’єднуючи такі багаторазові можливості, ChemPass AI може проектувати молекули, які одночасно задовольняють кілька показників продуктивності, що практично неможливо традиційними методами.
Стрибок за традиційні методи досліджень та розробок
Поява генеративної моделі ChemPass AI підкреслює ширший зсув у дослідженнях та розробках життя: перехід від трудомістких методів проб та помилок до AI-розширеної творчості та точності. На відміну від людських хіміків, які схильні дотримуватися відомих хімічних рядів та ітеруватися повільно, AI може охопити мільярди можливостей та заходити в не досліджені 99,9% хімічного простору. Це відкриває двері до відкриття ефективних сполук, які не нагадують нічого, що ми бачили раніше – це важливо для лікування захворювань з новою хімією чи боротьби з шкідниками та патогенами, які розвинули резистентність до існуючих молекул. Крім того, шляхом розгляду патентності з самого початку, генеративний AI допомагає уникнути зайнятих інтелектуальних областей. Evogene явно спрямована на виробництво молекул, які створюють нову інтелектуальну власність, важливу конкурентну перевагу.
Переваги над традиційними підходами можна підсумувати наступним чином:
-
Паралельна багатопaramетрова оптимізація: AI оцінює багато параметрів паралельно, проектуючи молекули, які задовольняють потужність, безпеку та інші критерії. Традиційні трубопроводи, навпаки, часто виявляють проблему токсичності лише після років роботи над перспективним препаратом. Виключивши такі питання заздалегідь, кандидати, розроблені AI, мають кращий шанс на успіх у пізніх дорогих випробуваннях.
-
Розширення хімічної різноманітності: Генеративні моделі не обмежені існуючими бібліотеками сполук. ChemPass AI може вигадувати структури, які ніколи не створювалися раніше, але передбачаються як ефективні. Це новизна-орієнтована генерація уникає винаходу колеса (або молекули) та допомагає створювати диференційовані продукти з новими механізмами дії. Традиційні методи часто призводять до “подібних” сполук, які пропонують мало новизни.
-
Швидкість та масштаб: Що команда хіміків могла б досягти через синтез та тестування за рік, AI може симулювати за кілька днів. Платформа глибокого навчання ChemPass AI може швидко віртуально скринінгувати десятки мільярдів сполук та генерувати сотні нових ідей за один запуск. Це драматично стискає термін відкриття, зосереджуючи експерименти в лабораторії лише на найбільш перспективних кандидатах, визначених в silico.
-
Інтегровані знання: Моделі AI, такі як ChemPass, включають величезну кількість хімічних та біологічних знань (наприклад, відомі структура-активність відносини, сигнали токсичності, правила лікарських властивостей) під час навчання. Це означає, що кожен дизайн молекули користується широким спектром попередніх даних, яких жоден людський експерт не міг би утримувати в своїй голові. Традиційний дизайн спирається на досвід медичних хіміків – цінний, але обмежений людською пам’яттю та упередженнями – тоді як AI може захопити закономірності по мільйонам експериментів та різноманітних хімічних сімей.
У практичних термінах для фармацевтики це може привести до вищого рівня успіху у клінічних випробуваннях та зменшення витрат на розробку, оскільки менше ресурсів витрачається на перспективні сполуки. У сільському господарстві це означає швидшу розробку безпечних та сталого захисту культури – наприклад, гербіциду, який є смертельним для бур’янів, але безпечним для неклітинних організмів та розкладається без шкоди для навколишнього середовища. Оптимізуючи одночасно ефективність та безпеку для навколишнього середовища, AI може допомогти доставити “ефективні, сталий та власницькі” агрохімікати, вирішуючи нормативні та резистентні проблеми одночасно.
Частина ширшого інструментарію AI в Evogene
Хоча ChemPass AI привертає увагу для дизайну малих молекул, вона є частиною тріо потужних “тех-двигунів” компанії Evogene, розроблених для різних областей. Компанія має MicroBoost AI для мікробів, ChemPass AI для хімії та GeneRator AI для генетичних елементів. Кожен двигун застосовує великомасштабну аналітику даних та машинне навчання до своєї галузі.
Ця інтегрована екосистема двигунів AI підкреслює стратегію компанії Evogene як “AI-орієнтованої” компанії життя. Вони спрямовані на революціонізування відкриття продуктів по всьому борту – чи то формулювання лікарського засобу, біостимулятора чи засухостійкої культури – шляхом використання обчислень для навігації біологічної складності. Двигуни мають спільну філософію: використовувати передові методи машинного навчання для підвищення ймовірності успіху у дослідженнях та розробках та зниження часу та витрат.
Перспектива: AI-керовані відкриття приходять у зрілість
Генеративний AI перетворює відкриття молекул, зміщуючи роль AI з помічника до творчого співробітника. Замість перевірки однієї ідеї за раз, вчені можуть тепер використовувати AI для проектування зовсім нових сполук, які одночасно задовольняють кілька цілей – потужність, безпека, стабільність та інше – у одному кроку.
Цей майбутній розвиток вже розгортається. Фармацевтична команда могла б запросити молекулу, яка націлена на певний білок, уникає мозку та є перорально доступною – AI може доставити кандидатів на вимогу. У сільському господарстві дослідники могли б генерувати екологічно чисті засоби боротьби зі шкідниками, адаптовані до нормативних та екологічних обмежень.
Недавня фундаментальна модель Evogene, розроблена у співпраці з Google Cloud, є одним із прикладів цього зсуву. Вона дозволяє багаторазовий дизайн та відкриває нові області хімічного простору. Коли майбутні версії дозволять ще більше налаштування, ці моделі стануть необхідними інструментами у галузі життя.
Вирішальне значення має реальна перевірка. Коли молекули, згенеровані AI, будуть протестовані та вдосконалені, моделі покращаться – створюючи потужний зворотний зв’язок між обчисленнями та експериментом.
Цей генеративний підхід не обмежується лікарськими засобами чи пестицидами. Він скоро зможе сприяти проривам у матеріалах, харчуванні та сталості – пропонуючи швидше, розумніше відкриття по галузях, які раніше були обмежені методами проб та помилок.












