Connect with us

AI har simulerat 500 miljoner år av evolution – och skapat ett nytt protein!

Artificiell intelligens

AI har simulerat 500 miljoner år av evolution – och skapat ett nytt protein!

mm

Evolution har under lång tid finslipat livet på molekylär nivå. Proteiner, som är livets grundläggande byggstenar, har utvecklats genom denna process för att utföra olika biologiska funktioner, från att bekämpa infektioner till att bryta ner mat. Dessa komplexa molekyler består av långa kedjor av aminosyror som är arrangerade i precisa sekvenser som dikterar deras struktur och funktion. Medan naturen har producerat en extraordinär mångfald av proteiner, har det länge varit en komplex utmaning för forskare att förstå deras struktur och designa helt nya proteiner.

De senaste framstegen inom artificiell intelligens förändrar vår förmåga att tackla några av biologins mest betydande utmaningar. Tidigare användes AI för att förutsäga hur en given proteinssekvens skulle veckas och bete sig – en komplex utmaning på grund av det stora antalet konfigurationer. Nyligen har AI utvecklats för att generera helt nya proteiner i en aldrig tidigare skådad skala. Denna milstolpe har uppnåtts med ESM3, en multimodal generativ språkmodell som utvecklats av EvolutionaryScale. Till skillnad från konventionella AI-system som är utformade för textbearbetning, har ESM3 utbildats för att förstå proteinssekvenser, strukturer och funktioner. Det som gör det verkligen remarkabelt är dess förmåga att simulera 500 miljoner år av evolution – en bedrift som har lett till skapandet av ett helt nytt fluorescerande protein, något som aldrig tidigare har setts i naturen.

Denna genombrott är ett betydande steg mot att göra biologi mer programmerbar, och öppnar upp nya möjligheter för att designa anpassade proteiner med tillämpningar inom medicin, materialvetenskap och bortom. I denna artikel undersöker vi hur ESM3 fungerar, vad det har uppnått och varför denna utveckling förändrar vår förståelse av biologi och evolution.

Möt ESM3: AI som simulerar evolution

ESM3 är en multimodal språkmodell som är utbildad för att förstå och generera proteiner genom att analysera deras sekvenser, strukturer och funktioner. Till skillnad från AlphaFold, som kan förutsäga strukturen hos existerande proteiner, är ESM3 i princip en proteinengineeringmodell, som tillåter forskare att specificera funktionella och strukturella krav för att designa helt nya proteiner.

Modellen har en djup förståelse av proteinssekvenser, strukturer och funktioner, samt förmågan att generera proteiner genom interaktion med användare. Denna förmåga möjliggör för modellen att generera proteiner som inte existerar i naturen, men som fortfarande är biologiskt livskraftiga. Skapandet av ett nytt grönt fluorescerande protein (esmGFP) är ett slående exempel på denna förmåga. Fluorescerande proteiner, som ursprungligen upptäcktes i maneter och koraller, används i stor utsträckning inom medicinsk forskning och bioteknik. För att utveckla esmGFP, tillhandahöll forskare ESM3 med nyckelstruktur och funktionella egenskaper hos kända fluorescerande proteiner. Modellen refinerade sedan designen iterativt, med användning av en kedja av tankar-tillvägagångssätt för att optimera sekvensen. Medan naturlig evolution kunde ta miljontals år för att producera ett liknande protein, accelererar ESM3 denna process för att uppnå det på dagar eller veckor.

AI-driven protein designprocess

Här är hur forskare har använt ESM3 för att utveckla esmGFP:

  1. Prompta AI – Initialt matade de in sekvens och strukturinformation för att vägleda ESM3 mot fluorescensrelaterade funktioner.
  2. Generera nya proteiner – ESM3 utforskade ett stort utrymme av potentiella sekvenser för att producera tusentals kandidatproteiner.
  3. Filtrera och förfining – De mest lovande designerna filtrerades och syntetiserades för laboratorietestning.
  4. Validering i levande celler – Utvalda AI-designade proteiner uttrycktes i bakterier för att bekräfta deras fluorescens och funktion.

Denna process har resulterat i ett fluorescerande protein (esmGFP) som inte liknar något i naturen.

Hur esmGFP jämför med naturliga proteiner

Det som gör esmGFP extraordinärt är hur avlägset det är från kända fluorescerande proteiner. Medan de flesta nyligen upptäckta GFP har små variationer från existerande, har esmGFP en sekvensidentitet på endast 58% till sin närmaste naturliga släkting. Evolutionärt sett motsvarar en sådan skillnad en divergerande tid på över 500 miljoner år.

För att sätta detta i perspektiv, var den senaste gången proteiner med liknande evolutionära avstånd uppstod, för att dinosaurierna ännu inte hade dykt upp, och flercelliga liv var fortfarande i sin linda. Detta betyder att AI inte bara har accelererat evolutionen – det har simulerat en helt ny evolutionär väg, och producerat proteiner som naturen kanske aldrig skulle ha skapat.

Varför denna upptäckt är viktig

Denna utveckling är ett betydande steg framåt inom proteinengineering och fördjupar vår förståelse av evolution. Genom att simulera miljontals år av evolution på bara dagar, öppnar AI upp nya möjligheter:

  • Snabbare läkemedelsupptäckt: Många läkemedel fungerar genom att rikta sig mot specifika proteiner, men att hitta rätt proteiner är långsamt och dyrt. AI-designade proteiner kunde påskynda denna process, och hjälpa forskare att upptäcka nya behandlingar mer effektivt.
  • Nya lösningar inom bioingenjörskonst: Proteiner används i allt från att bryta ner plastavfall till att upptäcka sjukdomar. Med AI-driven design kan forskare skapa anpassade proteiner för hälsovård, miljöskydd och till och med nya material.
  • AI som en evolutionär simulator: En av de mest intressanta aspekterna av denna forskning är att den positionerar AI som en simulator av evolution snarare än bara ett verktyg för analys. Traditionella evolutionära simulationer innebär att iterera genom genetiska mutationer, ofta tar månader eller år att generera livskraftiga kandidater. ESM3 kringgår dessa långsamma begränsningar genom att förutsäga funktionella proteiner direkt. Denna skiftning i tillvägagångssätt betyder att AI inte bara kan imitera evolution, utan aktivt utforska evolutionära möjligheter bortom naturen. Givet tillräcklig beräkningskraft, kunde AI-driven evolution avslöja nya biokemiska egenskaper som aldrig har funnits i den naturliga världen.

Ethiska överväganden och ansvarsfull AI-utveckling

Medan de potentiella fördelarna med AI-driven proteinengineering är enorma, väcker denna teknik också etiska och säkerhetsfrågor. Vad händer när AI börjar designa proteiner bortom mänsklig förståelse? Hur kan vi säkerställa att dessa proteiner är säkra för medicinskt eller miljömässigt bruk?

Vi måste fokusera på ansvarsfull AI-utveckling och omfattande testning för att hantera dessa problem. AI-genererade proteiner, som esmGFP, bör genomgå omfattande laboratorietestning innan de övervägs för verkliga tillämpningar. Dessutom utvecklas etiska ramar för AI-driven biologi för att säkerställa transparens, säkerhet och allmänhetens förtroende.

Sammanfattning

Lanseringen av ESM3 är en viktig utveckling inom bioteknik. ESM3 demonstrerar att evolution inte behöver vara en långsam, försöksbaserad process. Att komprimera 500 miljoner år av proteinutveckling till bara dagar öppnar en framtid där forskare kan designa helt nya proteiner med otrolig hastighet och precision. Utvecklingen av ESM3 betyder att vi inte bara kan använda AI för att förstå biologi, utan också för att forma den. Denna genombrott hjälper oss att förbättra vår förmåga att programmera biologi på samma sätt som vi programmerar programvara, och låser upp möjligheter som vi bara börjar föreställa oss.

Dr. Tehseen Zia är en fast anställd biträdande professor vid COMSATS University Islamabad, med en doktorsexamen i AI från Vienna University of Technology, Österrike. Specialiserad på artificiell intelligens, maskinlärning, datavetenskap och datorseende, har han gjort betydande bidrag med publikationer i ansedda vetenskapliga tidskrifter. Dr. Tehseen har också lett olika industriprojekt som huvudutredare och tjänstgjort som AI-konsult.