Connect with us

AI právě simulovala 500 milionů let evoluce – a vytvořila nový protein!

Umělá inteligence

AI právě simulovala 500 milionů let evoluce – a vytvořila nový protein!

mm

Evoluce již miliardy let jemně ladí život na molekulární úrovni. Proteiny, základní stavební kameny života, prošly touto procesem, aby vykonávaly různé biologické funkce, od boje proti infekcím až po trávení potravy. Tyto komplexní molekuly se skládají z dlouhých řetězců aminokyselin uspořádaných v přesných sekvencích, které určují jejich strukturu a funkci. Zatímco příroda vytvořila mimořádnou rozmanitost proteinů, pochopení jejich struktury a návrh zcela nových proteinů byl pro vědce dlouho složitou výzvou.

Poslední pokroky v oblasti umělé inteligence mění naše schopnosti řešit některé z největších biologických výzev. Předtím byla umělá inteligence použita k předpovědi, jak by se daná sekvence proteinu srolovala a chovala – složitá výzva kvůli obrovskému počtu konfigurací. Nedávno umělá inteligence pokročila ve generování zcela nových proteinů v bezprecedentním měřítku. Tento milník byl dosažen s ESM3, multimodálním generativním jazykovým modelem navrženým EvolutionaryScale. Na rozdíl od konvenčních systémů umělé inteligence navržených pro zpracování textu byl ESM3 trénován na pochopení sekvencí proteinů, struktur a funkcí. Co ho činí skutečně pozoruhodným, je jeho schopnost simulovat 500 milionů let evoluce – čin, který vedl k vytvoření zcela nového fluorescenčního proteinu, něco, co nebylo nikdy dříve viděno v přírodě.

Tento průlom je významným krokem směrem k tomu, aby se biologie stala více programovatelnou, a otevírá nové možnosti pro návrh vlastních proteinů s aplikacemi v medicíně, materiálovém inženýrství a dalších oblastech. V tomto článku prozkoumáme, jak ESM3 funguje, co dosáhl, a proč tento pokrok mění naše chápání biologie a evoluce.

Poznejte ESM3: Umělou inteligenci, která simuluje evoluci

ESM3 je multimodální jazykový model trénovaný na pochopení a generování proteinů analýzou jejich sekvencí, struktur a funkcí. Na rozdíl od AlphaFold, který může předpovědět strukturu existujících proteinů, je ESM3 v podstatě modelem proteinového inženýrství, který umožňuje výzkumníkům specifikovat funkční a strukturní požadavky pro návrh zcela nových proteinů.

Model obsahuje hluboké znalosti sekvencí proteinů, struktur a funkcí spolu se schopností generovat proteiny prostřednictvím interakce s uživateli. Tato schopnost umožňuje modelu generovat proteiny, které nemusí existovat v přírodě, a přesto zůstávají biologicky životaschopné. Vytvoření nového zeleného fluorescenčního proteinu (esmGFP) je působivou demonstrací této schopnosti. Fluorescenční proteiny, původně objevené v medúzách a korálech, jsou široce používány ve výzkumu a biotechnologii. Pro vývoj esmGFP poskytli výzkumníci ESM3 klíčové strukturní a funkční charakteristiky známých fluorescenčních proteinů. Model pak iterativně rafinoval návrh, aplikující řetězec myšlenkového procesu pro optimalizaci sekvence. Zatímco přirozená evoluce by mohla trvat miliony let, aby produkovala podobný protein, ESM3 urychluje tento proces, aby ho dosáhl za dny nebo týdny.

Proces návrhu proteinu s využitím umělé inteligence

Zde je, jak výzkumníci použili ESM3 k vývoji esmGFP:

  1. Aktivace umělé inteligence – Zpočátku zadali sekvence a strukturní podněty, aby nasměrovali ESM3 směrem k fluorescenčním funkcím.
  2. Generování nových proteinů – ESM3 prozkoumal rozsáhlý prostor potenciálních sekvencí, aby produkoval tisíce kandidátních proteinů.
  3. Filtrování a rafinace – Nejperspektivnější návrhy byly filtrovány a syntetizovány pro laboratorní testování.
  4. Validace v živých buňkách – Vybrané proteiny navržené umělou inteligencí byly exprimovány v bakteriích, aby se potvrdila jejich fluorescence a funkčnost.

Tento proces vedl k vytvoření fluorescenčního proteinu (esmGFP) nepodobného ničemu v přírodě.

Jak esmGFP srovnává s přírodními proteiny

Co činí esmGFP výjimečným, je to, jak vzdálený je od známých fluorescenčních proteinů. Zatímco většina nově objevených GFP má malé variace od existujících, esmGFP má sekvencí identitu pouze 58 % se svým nejbližším přírodním příbuzným. Evolučně odpovídá tato rozdílnost rozcházejícímu se času nad 500 milionů let.

Abychom to uvedli do perspektivy, naposledy se proteiny s podobnými evolučními vzdálenostmi objevily, když ještě dinosauři neexistovali a mnohobuněčné životy byly ještě v raných fázích. To znamená, že umělá inteligence neonly urychluje evoluci – simuluje zcela novou evoluční dráhu, produkující proteiny, které příroda možná nikdy nevytvořila.

Proč je toto objev důležité

Tento vývoj je významným krokem vpřed v inženýrství proteinů a prohlubuje naše chápání evoluce. Simulací milionů let evoluce za pouhé dny otevírá umělá inteligence dveře k novým možným aplikacím:

  • Rychlejší objevování léků: Mnohé léky fungují tak, že cílí na specifické proteiny, ale nalezení těch správných je pomalé a nákladné. Proteiny navržené umělou inteligencí by mohly urychlit tento proces, pomáhají výzkumníkům objevovat nové léčby efektivněji.
  • Nová řešení v bioinženýrství: Proteiny se používají ve všem, od rozkladu plastového odpadu až po detekci onemocnění. S umělou inteligencí navrženými proteiny mohou vědci vytvářet vlastní proteiny pro zdravotnictví, ochranu životního prostředí a dokonce i nové materiály.
  • Umělá inteligence jako simulační nástroj evoluce: Jedním z nejzajímavějších aspektů tohoto výzkumu je, že позиcionuje umělou inteligenci jako simulační nástroj evoluce, spíše než jen analytický nástroj. Tradiční evoluční simulace zahrnují iteraci přes genetické mutace, často trvající měsíce nebo roky, aby se generovali životaschopní kandidáti. ESM3 však obchází tyto pomalé omezení tím, že předpovídá funkční proteiny přímo. Tento posun v přístupu znamená, že umělá inteligence nemusí pouze napodobovat evoluci, ale aktivně prozkoumávat evoluční možnosti za hranicemi přírody. S dostatečnou výpočetní silou by umělá inteligence mohla odhalit nové biochemické vlastnosti, které nikdy neexistovaly v přírodním světě.

Etické úvahy a odpovědný vývoj umělé inteligence

Zatímco potenciální přínosy umělé inteligence v inženýrství proteinů jsou obrovské, tato technologie také vyvolává etické a bezpečnostní otázky. Co se stane, když umělá inteligence začne navrhovat proteiny za hranicemi lidského chápání? Jak zajistíme, že tyto proteiny jsou bezpečné pro lékařské nebo environmentální použití?

Musíme se zaměřit na odpovědný vývoj umělé inteligence a důkladné testování, abychom řešili tyto obavy. Proteiny generované umělou inteligencí, jako esmGFP, by měly podstoupit rozsáhlé laboratorní testování, než budou zvažovány pro reálné aplikace. Kromě toho se vyvíjejí etické rámce pro biologii řízenou umělou inteligencí, aby se zajistila transparentnost, bezpečnost a veřejná důvěra.

Závěrečné shrnutí

Spuštění ESM3 je zásadním vývojem v oblasti biotechnologie. ESM3 demonstruje, že evoluce nemusí být pomalým, pokusným procesem. Komprese 500 milionů let proteinové evoluce do pouhých dnů otevírá budoucnost, ve které vědci mohou navrhovat zcela nové proteiny s ohromující rychlostí a přesností. Vývoj ESM3 znamená, že můžeme použít umělou inteligenci nejen k pochopení biologie, ale také k jejímu přetvoření. Tento průlom pomáhá nám pokročit v naší schopnosti programovat biologii stejným způsobem, jako programujeme software, odemykaje možnosti, které jsme teprve začali představovat.

Dr. Tehseen Zia je docent s trvalým úvazkem na COMSATS University Islamabad, držitel titulu PhD v oblasti AI z Vienna University of Technology, Rakousko. Specializuje se na umělou inteligenci, strojové učení, datové vědy a počítačové vidění, a významně přispěl publikacemi v renomovaných vědeckých časopisech. Dr. Tehseen také vedl různé průmyslové projekty jako hlavní výzkumník a působil jako konzultant pro umělou inteligenci.