Artificiell intelligens
AI-system upptäcker ritningar för artificiella proteiner

Ett team av forskare från Pritzker School of Molecular Engineering (PME) vid University of Chicago har nyligen lyckats skapa ett AI-system som kan skapa helt nya, artificiella proteiner genom att analysera stora mängder data. Proteiner är makromolekyler som är avgörande för uppbyggnaden av vävnader i levande organismer och är kritiska för cellernas liv i allmänhet. Proteiner används av celler som kemiska katalysatorer för att göra olika kemiska reaktioner och för att utföra komplexa uppgifter. Om forskare kan ta reda på hur man kan konstruera artificiella proteiner på ett tillförlitligt sätt, kan det öppna dörrar till nya sätt att binda kol, nya metoder för att samla energi och nya behandlingsmetoder för sjukdomar. Artificiella proteiner har potentialen att dramatiskt förändra världen vi lever i. Som rapporterats av EurekaAlert, har en nylig genombrott av forskare vid PME University of Chicago fört forskare närmare dessa mål. Forskarna vid PME använde maskinlärningsalgoritmer för att utveckla ett system som kan generera nya former av proteiner. Forskarteamet skapade maskinlärningsmodeller som tränades på data från olika genombibliotek. När modellerna lärde sig, började de urskilja gemensamma underliggande mönster, enkla designregler, som möjliggör skapandet av artificiella proteiner. När forskarna syntetiserade proteinerna i laboratoriet, fann de att de artificiella proteinerna skapade kemiska reaktioner som var ungefär lika effektiva som de som drivs av naturligt förekommande proteiner. Enligt Joseph Regenstein Professor vid PME UC, Rama Ranganathan, fann forskarteamet att genombiblioteken innehåller en stor mängd information om proteinernas grundläggande funktioner och strukturer. Genom att använda maskinlärning för att känna igen dessa gemensamma strukturer, kunde forskarna “bottla naturens regler för att skapa proteiner själva”. Forskarna fokuserade på metaboliska enzymer i denna studie, specifikt en familj av proteiner som kallas korismatmutas. Denna proteinfamilj är nödvändig för liv i en mängd olika växter, svampar och bakterier. Ranganathan och medarbetare insåg att genombiblioteken innehåller insikter som bara väntar på att upptäckas av forskare, men att traditionella metoder för att bestämma reglerna för proteinstruktur och funktion endast har haft begränsad framgång. Teamet satte sig för att utveckla maskinlärningsmodeller som kan avslöja dessa designregler. Modellens fynd tyder på att nya artificiella sekvenser kan skapas genom att bevara aminosyrapositioner och korrelationer i evolutionen av aminosyrpar. Forskarteamet skapade syntetiska gener som kodade aminosyrasekvenser som producerade dessa proteiner. De klonade bakterier med dessa syntetiska gener och fann att bakterierna använde de syntetiska proteinerna i sin cellulära maskineri, fungerande nästan exakt som vanliga proteiner. Enligt Ranganathan kan de enkla regler som AI-systemet urskilde användas för att skapa artificiella proteiner av otrolig komplexitet och variation. Som Ranganathan förklarade för EurekaAlert: “Begränsningarna är mycket mindre än vad vi någonsin kunde föreställa oss. Det finns en enkelhet i naturens designregler, och vi tror att liknande tillvägagångssätt kan hjälpa oss att söka efter modeller för design i andra komplexa system i biologin, som ekosystem eller hjärnan.” Ranganathan och medarbetare vill ta sina modeller och generalisera dem, skapa en plattform som forskare kan använda för att bättre förstå hur proteiner konstrueras och vilka effekter de har. De hoppas på att använda sina AI-system för att möjliggöra för andra forskare att upptäcka proteiner som kan hantera viktiga frågor som klimatförändringar. Ranganathan och associate professor Andrew Ferguson har skapat ett företag som heter Evozyne, som syftar till att kommersialisera tekniken och främja dess användning inom områden som jordbruk, energi och miljö. Att förstå gemensamheterna mellan proteiner och sambanden mellan struktur och funktion kan också hjälpa till att skapa nya läkemedel och former av terapi. Även om proteinveckning länge har ansetts vara ett otroligt svårt problem för datorer att knäcka, kan insikterna från modeller som den som producerats av Ranganathans team hjälpa till att öka hastigheten på dessa beräkningar, vilket underlättar skapandet av nya läkemedel baserade på dessa proteiner. Läkemedel kan utvecklas som blockerar skapandet av proteiner inom virus, vilket potentiellt kan hjälpa till att behandla även nya virus som Covid-19-coronaviruset. Ranganathan och resten av forskarteamet behöver fortfarande förstå hur och varför deras modeller fungerar och hur de producerar tillförlitliga proteinritningar. Forskarteamets nästa mål är att bättre förstå vilka attribut modellerna tar hänsyn till för att komma fram till sina slutsatser.










