Kunstig intelligens
AI har simulert 500 millioner år med evolusjon – og skapt et nytt protein!
Evolusjon har finjustert liv på molekylært nivå i milliarder av år. Proteiner, de grunnleggende byggesteinene i liv, har utviklet seg gjennom denne prosessen for å utføre ulike biologiske funksjoner, fra å bekjempe infeksjoner til å fordøye mat. Disse komplekse molekylene består av lange kjeder av aminosyrer arrangerter i nøyaktige sekvenser som dikterer deres struktur og funksjon. Mens naturen har produsert en ekstraordinær mangfoldighet av proteiner, har forståelse av deres struktur og design av helt nye proteiner lenge vært en kompleks utfordring for forskerne.
De siste fremgangene i kunstig intelligens transformerer vår evne til å takle noen av biologiens største utfordringer. Tidligere ble AI brukt til å forutsi hvordan en gitt proteinsekvens ville foldes og oppføre seg – en kompleks utfordring på grunn av det enorme antallet konfigurasjoner. Nylig har AI utviklet seg til å generere helt nye proteiner i en utenforliggende skala. Denne milepælen er oppnådd med ESM3, en multimodal generativ språkmodell designet av EvolutionaryScale. I motsetning til konvensjonelle AI-systemer designet for tekstbehandling, er ESM3 trent til å forstå proteinsekvenser, strukturer og funksjoner. Det som gjør det virkelig bemerkelsesverdig er dets evne til å simulere 500 millioner år med evolusjon – en bedrift som har ledet til skapelsen av et helt nytt fluorescerende protein, noe som aldri før er sett i naturen.
Dette gjennombruddet er et viktig skritt mot å gjøre biologi mer programmerbar, og åpner opp nye muligheter for å designe tilpassede proteiner med anvendelser i medisin, materialvitenskap og utenfor. I denne artikkelen utforsker vi hvordan ESM3 fungerer, hva det har oppnådd, og hvorfor denne fremgangen former vår forståelse av biologi og evolusjon.
Møt ESM3: AI som simulerer evolusjon
ESM3 er en multimodal språkmodell trent til å forstå og generere proteiner ved å analysere deres sekvenser, strukturer og funksjoner. I motsetning til AlphaFold, som kan forutsi strukturen til eksisterende proteiner, er ESM3 i realiteten en proteinengineeringmodell, som lar forskerne spesifisere funksjonelle og strukturelle krav for å designe helt nye proteiner.
Modellen har dypt kunnskap om proteinsekvenser, strukturer og funksjoner, samt evnen til å generere proteiner gjennom en interaksjon med brukerne. Denne evnen gir modellen mulighet til å generere proteiner som kanskje ikke eksisterer i naturen, men likevel er biologisk gyldige. Skapelsen av et nytt grønt fluorescerende protein (esmGFP) er en slående demonstrasjon av denne evnen. Fluorescerende proteiner, som opprinnelig ble oppdaget i jellyfish og koraller, brukes bredt i medisinsk forskning og bioteknologi. For å utvikle esmGFP, ga forskerne ESM3 nøkkelstrukturelle og funksjonelle karakteristika til kjente fluorescerende proteiner. Modellen refinerer deretter designet, ved å bruke en chain-of-thought reasoning-tilnærming for å optimere sekvensen. Mens naturlig evolusjon kunne ta millioner av år for å produsere et lignende protein, akselererer ESM3 denne prosessen for å oppnå det på noen dager eller uker.
AI-drevet protein-designprosess
Her er hvordan forskerne har brukt ESM3 til å utvikle esmGFP:
- Prompting AI – Først inputtet de sekvens- og strukturelle hint til å guide ESM3 mot fluorescens-relaterte funksjoner.
- Generering av nye proteiner – ESM3 utforsket et stort rom av potensielle sekvenser for å produsere tusenvis av kandidatproteiner.
- Filtrering og refinering – De mest lovende designene ble filtrert og syntetisert for laboratorietesting.
- Validering i levende celler – Utvalgte AI-designete proteiner ble uttrykt i bakterier for å bekrefte deres fluorescens og funksjonalitet.
Denne prosessen har resultert i et fluorescerende protein (esmGFP) ulikt noe i naturen.
Hvordan esmGFP sammenlignes med naturlige proteiner
Det som gjør esmGFP ekstraordinært er hvor fjernt det er fra kjente fluorescerende proteiner. Mens de fleste nylig oppdagete GFP-er har små variasjoner fra eksisterende, har esmGFP en sekvensidentitet på bare 58% til sin nærmeste naturlige slektning. Evolusjonært sett tilsvarer en slik forskjell en divergeringstid på over 500 millioner år.
For å sette dette i perspektiv, var det siste gang proteiner med lignende evolusjonære avstander oppstod, at dinosaurer ennå ikke hadde dukket opp, og flercelleliv var fortsatt i sine tidlige stadier. Dette betyr at AI ikke bare har akselerert evolusjon – det har simulert en helt ny evolusjonær sti, og produsert proteiner som naturen kanskje aldri ville ha skapt.
Hvorfor denne oppdagelsen betyr noe
Denne utviklingen er et viktig skritt fremover i proteinengineering og dyper vår forståelse av evolusjon. Ved å simulere millioner av år med evolusjon på bare noen dager, åpner AI døren til spennende nye muligheter:
- Raskere legemiddelforskning: Mange legemidler virker ved å målrette bestemte proteiner, men å finne de riktige er tregt og dyrt. AI-designete proteiner kunne akselerere denne prosessen, og hjelpe forskerne med å oppdage nye behandlinger mer effektivt.
- Nye løsninger i bioteknologi: Proteiner brukes i alt fra å bryte ned plastavfall til å detektere sykdommer. Med AI-drevet design kan forskerne skape tilpassede proteiner for helse, miljøbeskyttelse og sogar nye materialer.
- AI som en evolusjonssimulator: En av de mest interessante aspektene ved denne forskningen er at den stiller AI som en simulator av evolusjon, snarere enn bare et verktøy for analyse. Tradisjonelle evolusjonssimuleringer innebærer å iterere gjennom genetiske mutasjoner, ofte tager måneder eller år for å generere gyldige kandidater. ESM3 omgår disse langsomme begrensningene ved å forutsi funksjonelle proteiner direkte. Denne skiftningen i tilnærming betyr at AI ikke bare kan etterligne evolusjon, men aktivt utforske evolusjonære muligheter utenfor naturen. Gitt nok beregningskraft, kunne AI-drevet evolusjon avdekke nye biokjemiske egenskaper som aldri har eksistert i den naturlige verden.
Ethiske overveielser og ansvarlig AI-utvikling
Mens de potensielle fordelene med AI-drevet proteinengineering er enorme, reiser denne teknologien også etiske og sikkerhetsmessige spørsmål. Hva skjer når AI begynner å designe proteiner utenfor menneskelig forståelse? Hvordan sikrer vi at disse proteinene er trygge for medisinsk eller miljømessig bruk?
Vi må fokusere på ansvarlig AI-utvikling og omfattende testing for å takle disse bekymringene. AI-genererte proteiner, som esmGFP, bør gjennomgå omfattende laboratorietesting før de kan vurdere for virkelige anvendelser. I tillegg utvikles etiske rammeverk for AI-drevet biologi for å sikre transparens, sikkerhet og offentlig tillit.
Det viktigste
Lanseringen av ESM3 er en vital utvikling i bioteknologifeltet. ESM3 demonstrerer at evolusjon ikke behøver å være en treg, prøv-og-feil-prosess. Å komprimere 500 millioner år med protein-evolusjon til bare noen dager, åpner en fremtid hvor forskerne kan designe helt nye proteiner med ufattelig hastighet og nøyaktighet. Utviklingen av ESM3 betyr at vi ikke bare kan bruke AI til å forstå biologi, men også til å forme den. Dette gjennombruddet hjelper oss å fremme vår evne til å programmere biologi på samme måte som vi programmerer programvare, og åpner muligheter vi bare begynner å forestille oss.












