Connect with us

AI on simuloitu 500 miljoonan vuoden evoluutio – ja luonut uuden proteiinin!

Tekoäly

AI on simuloitu 500 miljoonan vuoden evoluutio – ja luonut uuden proteiinin!

mm

Evoluutio on viimeistellyt elämää molekyylitasolla miljardeja vuosia. Proteiinit, elämän perusrakennusosat, ovat kehittyneet tällä prosessilla suorittamaan erilaisia biologisia funktioita, tartuntojen torjunnasta ruoan sulattamiseen. Nämä monimutkaiset molekyylit koostuvat pitkistä aminohappoketjuista, jotka on järjestetty tarkasti määrättyihin järjestyksiin, jotka määräävät niiden rakenteen ja toiminnan. Vaikka luonto on tuottanut erinomaisen monimuotoisen valikoiman proteiineja, niiden rakenteen ymmärtäminen ja kokonaan uusien proteiinien suunnittelu on ollut pitkään kompleksinen haaste tutkijoille.

Viimeaikaiset edistysaskeleet tekoälyssä muuttavat kykyämme ratkaista jotkut biologian merkittävimmistä haasteista. Aikaisemmin tekoälyä käytettiin ennustamaan, miten tietty proteiinisekvenssi taittuisi ja käyttäytyisi – monimutkainen haaste johtuen valtavasta määrästä konfiguraatioita. Viimeaikaisesti tekoäly on edennyt generoimaan kokonaan uusia proteiineja ennennäkemättömässä mittakaavassa. Tämä merkkipaalu on saavutettu ESM3:n avulla, monitilamuotoisella generatiivisella kielen mallilla, jonka on suunnitellut EvolutionaryScale. Toisin kuin perinteiset tekoälyjärjestelmät, jotka on suunniteltu tekstin käsittelyyn, ESM3 on koulutettu ymmärtämään proteiinisekvenssejä, -rakenteita ja -funktioita. Se, mikä tekee siitä todella merkittävän, on sen kyky simuloida 500 miljoonan vuoden evoluutio – saavutus, joka on johtanut täysin uuden fluoresoivan proteiinin luomiseen, jotain, mitä ei ole aiemmin nähty luonnossa.

Tämä läpimurto on merkittävä askel biologian ohjelmoitavuuden lisäämisessä, avaen uusia mahdollisuuksia mukautettujen proteiinien suunnittelussa sovelluksilla lääketieteessä, materiaalitieteessä ja muualla. Tässä artikkelissa tutkimme, miten ESM3 toimii, mitä se on saavuttanut ja miksi tämä edistysaskel muuttaa biologian ja evoluution ymmärtämistämme.

Tutustu ESM3:lle: Tekoäly, joka simuloi evoluutiota

ESM3 on monitilamuotoinen kielen malli, joka on koulutettu ymmärtämään ja generoimaan proteiineja analysoimalla niiden sekvenssejä, rakenteita ja funktioita. Toisin kuin AlphaFold, joka voi ennustaa olemassa olevien proteiinien rakenteen, ESM3 on perustavasti proteiinisuunnittelumalli, joka sallii tutkijoille määritellä toiminnalliset ja rakenteelliset vaatimukset suunnitellaan kokonaan uusia proteiineja.

Malli sisältää syvän tietämyksen proteiinisekvensseistä, -rakenteista ja -funktioista sekä kyvyn generoida proteiineja vuorovaikutuksen kautta käyttäjien kanssa. Tämä kyky mahdollistaa mallin generoida proteiineja, jotka eivät välttämättä ole olemassa luonnossa, mutta ovat silti biologisesti elinkelpoisia. Uuden vihreän fluoresoivan proteiinin (esmGFP) luominen on hämmästyttävä esimerkki tästä kyvystä. Fluoresoivat proteiinit, joita alun perin löydettiin meduusoista ja koralleista, ovat laajalti käytössä lääketieteellisessä tutkimuksessa ja biotekniikassa. EsmGFP:n kehittämiseksi tutkijat antoivat ESM3:lle avainrakenteellisia ja toiminnallisia piirteitä tunnetuista fluoresoivista proteiineista. Malli sitten iteratiivisesti hienonsi suunnittelua soveltamalla chain-of-thought reasoning -lähestymistapaa optimoida sekvenssiä. Vaikka luonnon evoluutio voisi kestää miljoonia vuosia tuottaa samanlainen proteiini, ESM3 kiihdyttää tätä prosessia saavuttaakseen sen päivissä tai viikoissa.

Tehtäväkohtainen proteiinisuunnitteluprosessi

Tässä on, miten tutkijat ovat käyttäneet ESM3:ta kehittääkseen esmGFP:n:

  1. Ohjelmointi tekoälylle – Aluksi he syöttivät sekvenssi- ja rakennetta koskevia vihjeitä ohjataksesi ESM3:aa fluoresenssiin liittyviin piirteisiin.
  2. Uusien proteiinien generointi – ESM3 tutki laajan avaruuden potentiaalisia sekvenssejä tuottaakseen tuhansia ehdokasproteiineja.
  3. Suodatus ja hienosäätö – Lupaavimmat suunnitelmat suodatettiin ja syntetisoitiin laboratoriotestaukseen.
  4. Validointi elävissä soluissa – Valitut tekoälysuunnitellut proteiinit ilmennettiin bakteereissa vahvistaakseen niiden fluoresenssin ja toiminnan.

Tämä prosessi on johtanut fluoresoivan proteiinin (esmGFP) luomiseen, joka on erilainen kuin mikään luonnossa.

Miten esmGFP vertautuu luonnon proteiineihin

Se, mikä tekee esmGFP:stä poikkeuksellisen, on se, kuinka kaukana se on tunnetuista fluoresoivista proteiineista. Vaikka useimmat uudelleen löydetyt GFP:t ovat lieviä muunnelmia olemassa olevista, esmGFP:llä on sekvenssitunniste 58%:ia lähimpään luonnolliseen sukulaiseensa. Evoluutiossa tämä ero vastaa yli 500 miljoonan vuoden divergenssiajaa.

Jotta voisimme ymmärtää tämän asiayhteyden, viimeksi proteiinit, joilla on samanlainen evolutiivinen etäisyys, ilmestyivät, dinosaurukset eivät olleet vielä ilmaantuneet, ja monisoluiset elämänmuodot olivat edelleen varhaisessa vaiheessaan. Tämä tarkoittaa, että tekoäly ei ole ainoastaan kiihdyttänyt evoluutiota – se on simuloitu täysin uuden evoluutiohaaran, tuottaen proteiineja, joita luonto ei ehkä koskaan olisi luonut.

Miksi tämä löytö on merkittävä

Tämä kehitys on merkittävä askel proteiinisuunnittelussa ja syventää ymmärtämystämme evoluutiosta. Simuloimalla miljoonia vuosia evoluutiota vain päivissä tekoäly avaa ovia jännittäviin uusiin mahdollisuuksiin:

  • Nopeampi lääkekehitys: Monet lääkkeet toimivat kohdistamalla tiettyjä proteiineja, mutta oikeiden löytäminen on hidasta ja kallista. Tekoälysuunnitellut proteiinit voivat nopeuttaa tätä prosessia, auttaen tutkijoita löytämään uusia hoitokeinoja tehokkaammin.
  • Uudet ratkaisut biotekniikassa: Proteiineja käytetään kaikessa aina muovijätteen murskaamisesta sairauksien havaitsemiseen. Tekoälyohjatuilla suunnittelulla tutkijat voivat luoda mukautettuja proteiineja terveydenhuoltoon, ympäristönsuojeluun ja jopa uusien materiaalien kehittämiseen.
  • Tehtäväkohtainen evoluutio: Yksi tämän tutkimuksen mielenkiintoisimmista aspekteista on, että se asettaa tekoälyn evoluution simulaattoriksi eikä ainoastaan analyysityökaluksi. Perinteiset evoluutiosimulaatiot käyttävät geneettisiä mutaatioita, usein kestäen kuukausia tai vuosia, jotta ne voivat tuottaa elinkelpoisia ehdokkaita. ESM3 kuitenkin ohittaa nämä hitaat rajoitukset ennustaamalla suoraan toimivia proteiineja. Tämä lähestymistapan muutos tarkoittaa, että tekoäly ei ainoastaan jäljittele evoluutiota vaan voi myös aktiivisesti tutkia evoluutioon perustuvia mahdollisuuksia luonnon ulkopuolella. Riittävän laskentakapasiteetin kanssa tekoälyvoittoinen evoluutio voi paljastaa uusia biokemiallisia ominaisuuksia, joita ei ole aiemmin ollut luonnossa.

    Eettiset huomioonotot ja vastuullinen tekoälykehitys

    Vaikka tekoälyohjatun proteiinisuunnittelun potentiaaliset hyödyt ovat valtavat, tämä teknologia herättää myös eettisiä ja turvallisuuskeskustelua. Mitä tapahtuu, kun tekoäly alkaa suunnitella proteiineja, joita ihminen ei ymmärrä? Miten varmistamme, että nämä proteiinit ovat turvallisia lääketieteelliseen tai ympäristöön käyttöön?

    Meidän on keskityttävä vastuulliseen tekoälykehitykseen ja perusteelliseen testaukseen ratkaisemaan nämä huolenaiheet. Tekoälygeneroimat proteiinit, kuten esmGFP, tulisi käydä läpi perusteellisessa laboratoriotestauksessa ennen kuin niitä voidaan harkita käytettäviksi todellisissa sovelluksissa. Lisäksi eettiset kehykset tekoälyohjatuille biologisille sovelluksille kehitetään varmistamaan avoimuus, turvallisuus ja yleinen luottamus.

    Yhteenveto

    ESM3:n lanseeraus on tärkeä kehitys biotekniikan alalla. ESM3 osoittaa, että evoluution ei tarvitse olla hidasta, kohtiin perustuvaa prosessia. Pienentämällä 500 miljoonan vuoden proteiinievoluutiota vain päiviksi avaa tulevaisuuden, jossa tutkijat voivat suunnitella täysin uusia proteiineja uskomattoman nopeasti ja tarkasti. ESM3:n kehitys tarkoittaa, että voimme käyttää tekoälyä ymmärtääksemme biologiaa ja muokata sitä. Tämä läpimurto auttaa meitä edistämään biologian ohjelmoitavuutta ohjelmistojen tapaan, avaen mahdollisuuksia, joita emme ole vielä edes kuvitelleet.

Tohtori Tehseen Zia on COMSATS University Islamabadin apulaisprofessori, joka on suorittanut AI-tutkinnon Wienin Teknillisen yliopiston, Itävallassa. Erityisalanaan ovat Tekoäly, Konenäkö, Data Science ja Machine Learning, ja hän on tehnyt merkittäviä töitä julkaisemalla artikkeleita arvostetuissa tieteellisissä lehdissä. Tohtori Tehseen on myös johtanut useita teollisuusprojekteja pää tutkijana ja toiminut AI-konsulttina.