Свържете се с нас

Evogene и Google Cloud представят базов модел за генеративен дизайн на молекули, поставяйки началото на нова ера в изкуствения интелект в науките за живота

Изкуствен интелект

Evogene и Google Cloud представят базов модел за генеративен дизайн на молекули, поставяйки началото на нова ера в изкуствения интелект в науките за живота

mm

Еводжин ООДпредстави първи в класа си генеративен модел на основата на изкуствения интелект за дизайн на малки молекули, което отбелязва пробив в начина, по който се откриват нови съединения. оповестен На 10 юни 2025 г., в сътрудничество с Google Cloud, моделът разширява платформата ChemPass AI на Evogene и се справя с дългогодишно предизвикателство както във фармацевтиката, така и в селското стопанство: намирането на нови молекули, които отговарят едновременно на множество сложни критерии. Тази разработка е готова да ускори научноизследователската и развойна дейност в областта на откриването на лекарства и защитата на културите, като позволи едновременната оптимизация на свойства като ефикасност, токсичност и стабилност в рамките на един цикъл на проектиране.

От последователен скрининг до едновременно проектиране

В традиционните изследвания на лекарства и селскостопански химикали, учените обикновено тестват един фактор в даден момент – първо проверяват дали дадено съединение работи, а след това тестват за безопасност и стабилност. Този поетапен метод е бавен, скъп и често завършва с неуспех, като много обещаващи съединения не успяват да постигнат желаните резултати на по-късни етапи. Той също така държи изследователите фокусирани върху познати химични структури, ограничавайки иновациите и затруднявайки създаването на нови, патентоспособни продукти. Този остарял подход допринася за високи разходи, дълги срокове и нисък процент на успех – около 90% от кандидатите за лекарства се провалят, преди да достигнат пазара.

Генеративният изкуствен интелект променя тази парадигма. Вместо филтриране едно по едно, моделите с изкуствен интелект могат да жонглират с множество изисквания едновременно, проектирайки молекули, които да бъдат мощни, безопасни и стабилни от самото начало. Новият основен модел на Evogene е изграден специално, за да позволи този едновременен многопараметричен дизайн. Този подход има за цел да намали риска от по-късни фази на разработка, като включа съображения като ADME и токсичност в първоначалния дизайн.

На практика това може да означава по-малко неуспехи в късен етап – например, по-малко кандидат-лекарства, които показват отлични лабораторни резултати, само за да се провалят в клинични изпитвания поради странични ефекти. Накратко, генеративният изкуствен интелект позволява на изследователите да внедряват иновации по-бързо и по-умно, като едновременно с това оптимизират многото аспекти на една успешна молекула, вместо да се справят с всеки един поотделно.

Вътре в ChemPass AI: Как генеративните модели проектират молекули

В основата на платформата ChemPass AI на Evogene е мощен нов базов модел, обучен върху огромен набор от химически данни. Компанията е сглобила... курирана база данни с приблизително 40 милиарда молекулярни структури– обхващащи известни лекарственоподобни съединения и разнообразни химически скелета – за да научи ИИ на „езика“ на молекулите. Използвайки инфраструктурата Vertex AI на Google Cloud със суперкомпютри с графичен процесор, моделът научи модели от тази огромна химическа библиотека, което му даде безпрецедентен обхват от знания за това как изглеждат лекарственоподобните молекули. Този масивен режим на обучение е подобен на обучението на голям езиков модел, но вместо човешки език, ИИ научи химически представяния.

Генеративният модел на Evogene е изграден върху архитектура на трансформаторна невронна мрежа, подобна на GPT моделите, които революционизираха обработката на естествен език. Всъщност системата се нарича ChemPass-GPT, патентован AI модел, обучен върху SMILES низове (текстово кодиране на молекулярни структури). Казано по-просто, ChemPass-GPT третира молекулите като изречения – SMILES низът на всяка молекула е поредица от символи, описващи нейните атоми и връзки. Трансформиращият модел е научил граматиката на този химичен език, което му позволява да „пише“ нови молекули, като предсказва по един символ наведнъж, по същия начин, по който GPT може да пише изречения буква по буква. Тъй като е обучен върху милиарди примери, моделът може да генерира нови SMILES, които съответстват на химически валидни, подобни на лекарства структури.

Това генеративен подход, базиран на последователности използва силата на трансформаторите при улавяне на сложни модели. Чрез обучение върху такъв огромен и химически разнообразен набор от данни, ChemPass AI преодолява проблемите, с които са се сблъсквали по-ранните модели на AI, като например отклонения от малки набори от данни или генериране на излишни или невалидни молекули. Производителността на базовия модел вече далеч надминава генеричен GPT, приложен към химията: вътрешни тестове показаха около 90% точност при производството на нови молекули, които отговарят на всички критерии за проектиране, в сравнение с ~29% точност за традиционен модел, базиран на GPTevogene.comНа практика това означава, че почти всички молекули, които ChemPass AI предлага, са не само нови, но и достигат целевия си профил, което е поразително подобрение спрямо базовите генеративни техники.

Въпреки че основният генеративен двигател на Evogene използва трансформатор върху линейни SMILES, заслужава да се отбележи, че по-широкият набор от инструменти за изкуствен интелект включва и други архитектури като графични невронни мрежи (GNN)Молекулите са естествено графи – с атоми като възли и връзки като ръбове – и GNN (генетични невронни мрежи) могат директно да разсъждават върху тези структури. В съвременния дизайн на лекарства, GNN често се използват за предсказване на свойства или дори за генериране на молекули чрез изграждането им атом по атом. Този графично-базиран подход допълва моделите на последователности; например, платформата на Evogene включва и инструменти като DeepDock за 3D виртуален скрининг, които вероятно използват дълбоко обучение за оценка на свързването на молекули в структурно-базиран контекст. Чрез комбиниране на модели на последователности (чудесни за креативност и новост) с графично-базирани модели (чудесни за структурна точност и предсказване на свойства), ChemPass AI гарантира, че генерираните от него съединения са не само нови на хартия, но и химически стабилни и ефективни на практика. Цикълът на проектиране на ИИ може да генерира кандидат-структури и след това да ги оцени чрез предсказващи модели – някои евентуално базирани на GNN – по критерии като токсичност или синтетична осъществимост, създавайки цикъл на обратна връзка, който усъвършенства всяко предложение.

Многоцелева оптимизация: Ефективност, Токсичност, Стабилност Всичко наведнъж

Отличителна черта на ChemPass AI е вградената му способност за многоцелева оптимизация. Класическото откриване на лекарства често оптимизира едно свойство в даден момент, но ChemPass е проектиран да обработва много цели едновременно. Това се постига чрез усъвършенствани техники за машинно обучение, които насочват генеративния модел към удовлетворяване на множество ограничения. В процеса на обучение Evogene може да наложи изисквания за свойства – например молекулата трябва силно да активира определена цел, да избягва определени токсични мотиви и да има добра бионаличност – и моделът се научава да се ориентира в химическото пространство съгласно тези правила. Системата ChemPass-GPT дори позволява „генериране, базирано на ограничения“, което означава, че може да бъде инструктирана да предлага само молекули, които отговарят на специфични желани свойства от самото начало.

Как изкуственият интелект постига това многопараметрично балансиране? Един подход е многозадачното обучение, при което моделът не само генерира молекули, но и предсказва техните свойства, използвайки научени предиктори, като съответно коригира генерирането. Друг мощен подход е обучение с подсилване (RL)В работен процес, подобрен с RL, генеративният модел действа като агент, който „играе игра“ на дизайн на молекули: той предлага молекула и след това получава оценка за награда въз основа на това колко добре тази молекула отговаря на целите (ефективност, липса на токсичност и др.). В продължение на много итерации моделът настройва стратегията си за генериране, за да увеличи максимално тази награда. Този метод е използван успешно в други системи за дизайн на лекарства, управлявани от изкуствен интелект – изследователи са показали, че Алгоритмите за обучение с подсилване могат да насочват генеративните модели за производство на молекули с желани свойстваПо същество, изкуственият интелект може да бъде обучен с функция за възнаграждение, която капсулира множество цели, например даване на точки за прогнозирана ефикасност и изваждане на точки за прогнозирана токсичност. След това моделът оптимизира своите „ходове“ (добавяне или премахване на атоми, промяна на функционални групи), за да постигне най-висок резултат, като ефективно се учи на компромисите, необходими за удовлетворяване на всички критерии.

Evogene не е разкрила точния патентован принцип зад многоцелевия двигател на ChemPass AI, но от резултатите им е ясно, че подобни стратегии работят. Фактът е, че всяко генерирано съединение „едновременно отговаря на основни параметри“ като ефикасност, синтезируемост и безопасност. Предстоящата версия 2.0 на ChemPass AI ще разшири това – тя се разработва, за да позволи още по-гъвкаво многопараметрично настройване, включително дефинирани от потребителя критерии, съобразени със специфични терапевтични области или изисквания на културите. Това предполага, че моделът от следващо поколение би могъл да позволи на изследователите да увеличат или намалят важността на определени фактори (например, приоритизиране на проникването в мозъка за неврологично лекарство или биоразградимостта в околната среда за пестицид) и изкуственият интелект ще коригира своята стратегия за проектиране съответно. Чрез интегриране на такива многоцелеви възможности, ChemPass AI може да проектира молекули, които достигат идеалните резултати по множество показатели за производителност едновременно, подвиг, практически невъзможен с традиционните методи.

Скок отвъд традиционните методи за научноизследователска и развойна дейност

Появата на генеративния модел на ChemPass AI подчертава по-широка промяна в научноизследователската и развойна дейност в областта на науките за живота: преминаването от трудоемки работни процеси, базирани на проба и грешка, към Креативност и прецизност, допълнени от изкуствен интелектЗа разлика от хората химици, които са склонни да се придържат към известни химични серии и да извършват бавни итерии, изкуственият интелект може да проумее милиарди възможности и да се впусне в неизследваните 99.9% от химическото пространство. Това отваря вратата за намиране на ефикасни съединения, които не приличат на нищо, което сме виждали преди – от решаващо значение за лечение на болести с нова химия или за справяне с вредители и патогени, които са развили резистентност към съществуващи молекули. Освен това, като се вземе предвид... патентоспособност Още от самото начало, генеративният изкуствен интелект помага да се избегнат пренаселени области на интелектуална собственост. Evogene изрично се стреми да произвежда молекули, които създават нова интелектуална собственост, което е важно конкурентно предимство.

Предимствата пред традиционните подходи могат да бъдат обобщени, както следва:

  • Паралелна оптимизация с множество характеристики: Изкуственият интелект оценява много параметри едновременно, проектирайки молекули, които отговарят на критериите за ефикасност, безопасност и други. Традиционните разработки, за разлика от тях, често откриват проблем с токсичността едва след години работа върху иначе обещаващо лекарство. Чрез превантивно филтриране за такива проблеми, разработените от изкуствен интелект кандидати имат по-голям шанс за успех в скъпи по-късни изпитвания.

  • Разширяване на химическото разнообразие: Генеративните модели не се ограничават до съществуващите библиотеки от съединения. ChemPass AI може да създава структури, които никога преди не са били създавани, но се очаква да бъдат ефективни. Това поколение, водено от новости избягва преоткриването на колелото (или молекулата) и помага за създаването на диференцирани продукти с нови начини на действие. Традиционните методи често водят до „аз също“ съединения, които предлагат малко новост.

  • Скорост и мащаб: Това, което екип от химици може да постигне чрез синтез и тестване за една година, един изкуствен интелект може да симулира за дни. Платформата за дълбоко обучение на ChemPass AI може виртуално да скринира десетки милиарди съединения бързо и да генерира стотици нови идеи с еднократно изпълнение. Това драстично компресира времевата линия за откриване, фокусирайки експериментите в мокра лаборатория само върху най-обещаващите кандидати, идентифицирани in silico.

  • Интегрирани знания: Модели с изкуствен интелект, като ChemPass, включват огромни количества химични и биологични знания (напр. известни зависимости структура-активност, предупреждения за токсичност, правила за лекарственоподобни свойства) в своето обучение. Това означава, че всеки молекулен дизайн се възползва от широк спектър от предварителни данни, които никой отделен човек-експерт не би могъл да държи в главата си. Традиционният дизайн разчита на опита на медицинските химици – ценен, но ограничен до човешката памет и пристрастия – докато изкуственият интелект може да улавя модели в милиони експерименти и разнообразни химически семейства.

На практика, за фармацевтичните компании това би могло да доведе до по-високи нива на успех в клиничните изпитвания и намалени разходи за разработка, тъй като по-малко ресурси се губят за обречени на провал съединения. В селското стопанство това означава по-бързо създаване на по-безопасни и по-устойчиви решения за растителна защита – например хербицид, който е смъртоносен за плевелите, но безвреден за нецелевите организми и се разгражда безвредно в околната среда. Чрез оптимизиране на ефикасността и екологичната безопасност едновременно, изкуственият интелект може да помогне за предоставянето на „ефективни, устойчиви и патентовани“ агрохимикали, като едновременно се справя с регулаторните предизвикателства и предизвикателствата, свързани с резистентността.

Част от по-широк набор от инструменти за изкуствен интелект в Evogene

Въпреки че ChemPass AI е в центъра на вниманието при дизайна на малки молекули, той е част от триото на Evogene, задвижвани от изкуствен интелект, „технологични двигатели“, пригодени за различни области. Компанията има MicroBoost AI фокусирайки се върху микробите, ChemPass AI по химия и Генератор AI върху генетични елементи. Всеки двигател прилага анализ на големи данни и машинно обучение в съответната си област.

Тази интегрирана екосистема от двигатели с изкуствен интелект подчертава стратегията на Evogene като компания за науки за живота, ориентирана към изкуствения интелект. Те се стремят да революционизират откриването на продукти във всички области – независимо дали става въпрос за формулиране на лекарство, биостимулант или устойчива на суша култура – ​​чрез използване на изчисленията за справяне с биологичната сложностДвигателите споделят обща философия: използват авангардно машинно обучение, за да увеличат вероятността за успех на научноизследователската и развойна дейност и да намалят времето и разходите.

Перспектива: Откриването, задвижвано от изкуствен интелект, набира скорост

Генеративният изкуствен интелект трансформира откриването на молекули, като измества ролята на ИИ от асистент в творчески сътрудник. Вместо да тестват една идея наведнъж, учените вече могат да използват ИИ, за да проектират изцяло нови съединения, които отговарят на множество цели – ефикасност, безопасност, стабилност и други – в една стъпка.

Това бъдеще вече се разгръща. Фармацевтичен екип може да поиска молекула, която е насочена към специфичен протеин, избягва мозъка и е достъпна през устата – изкуственият интелект може да доставя кандидати при поискване. В селското стопанство изследователите биха могли да създадат екологични средства за контрол на вредителите, съобразени с регулаторните и екологични ограничения.

Неотдавнашният основен модел на Evogene, разработен с Google Cloud, е един пример за тази промяна. Той позволява многопараметричен дизайн и отваря нови области в химическото пространство. Тъй като бъдещите версии позволяват още по-голяма персонализация, тези модели ще се превърнат в основни инструменти в науките за живота.

Най-важното е, че въздействието зависи от валидирането в реалния свят. С тестването и усъвършенстването на генерираните от изкуствен интелект молекули, моделите се подобряват, създавайки мощна обратна връзка между изчисленията и експериментите.

Този генеративен подход не се ограничава само до лекарства или пестициди. Той скоро би могъл да доведе до пробиви в материалите, храните и устойчивостта, предлагайки по-бързи и по-интелигентни открития в различни индустрии, някога ограничавани от метода на проба и грешка.

Антоан е далновиден лидер и партньор-основател на Unite.AI, воден от непоколебима страст за оформяне и насърчаване на бъдещето на ИИ и роботиката. Сериен предприемач, той вярва, че изкуственият интелект ще бъде толкова разрушителен за обществото, колкото електричеството, и често е хващан да бълнува за потенциала на пробивните технологии и AGI.

Като футурист, той е посветен на изследването как тези иновации ще оформят нашия свят. Освен това той е основател на Ценни книжа.io, платформа, фокусирана върху инвестиране в авангардни технологии, които предефинират бъдещето и прекрояват цели сектори.