Kunstig intelligens
AI-systemer opdager tegninger til kunstige proteiner

Et hold af forskere fra Pritzker School of Molecular Engineering (PME) på University of Chicago har nylig lykkes i oprettelsen af et AI-system, der kan oprette helt nye, kunstige proteiner ved at analysere store mængder af data.
Proteiner er makromolekyler, der er essentielle for opbygningen af væv i levende organismer, og kritiske for cellernes liv i almindelighed. Proteiner bruges af cellerne som kemiske katalysatorer til at fremme forskellige kemiske reaktioner og til at udføre komplekse opgaver. Hvis videnskabsfolk kan finde ud af, hvordan de kan konstruere kunstige proteiner på en pålidelig måde, kan det åbne døren for nye måder at fange carbon, nye metoder til at høste energi og nye behandlinger af sygdomme. Kunstige proteiner har magten til at ændre verden, vi lever i, dramatisk. Som rapporteret af EurekaAlert, har en ny gennembrud af forskere på PME University of Chicago bragt videnskabsfolk tættere på disse mål. Forskerne på PME brugte machine learning-algoritmer til at udvikle et system, der kan generere nye former for protein.
Forskningsholdet oprettede machine learning-modeller, der var trænet på data fra forskellige genom-databaser. Da modellerne lærte, begyndte de at skelne mellem fælles underliggende mønstre, simple designregler, der muliggør oprettelsen af kunstige proteiner. Da forskerne syntetiserede proteinerne i laboratoriet, fandt de, at de kunstige proteiner oprettede kemiske reaktioner, der var næsten lige så effektive som de, der blev drevet af naturligt forekommende proteiner.
Ifølge Joseph Regenstein Professor på PME UC, Rama Ranganathan, fandt forskningsholdet, at genom-data indeholder en masse information om proteiners grundlæggende funktioner og strukturer. Ved at bruge machine learning til at genkende disse fælles strukturer, var forskerne “i stand til at indfange naturens regler for at oprette proteiner selv.”
Forskerne fokuserede på metaboliske enzymer i denne studie, specifikt en familie af proteiner kaldet chorismat mutase. Denne protein-familie er nødvendig for liv i en bred vifte af planter, svampe og bakterier.
Ranganathan og medarbejdere indså, at genom-databaser indeholdt indsigt, der blot ventede på at blive opdaget af videnskabsfolk, men at traditionelle metoder til at bestemme reglerne om protein-struktur og -funktion kun havde haft begrænsede succes. Holdet satte sig for at designe machine learning-modeller, der var i stand til at afsløre disse designregler. Modellernes fund tyder på, at nye kunstige sekvenser kan oprettes ved at bevare aminosyrepositioner og korrelationer i evolutionen af aminosyrepar.
Holdet af forskere oprettede syntetiske gener, der kodede for aminosyresekvenser, der producerede disse proteiner. De klonede bakterier med disse syntetiske gener og fandt, at bakterierne brugte de syntetiske proteiner i deres cellulære maskineri, fungerende næsten præcis som regulære proteiner.
Ifølge Ranganathan kan de simple regler, som deres AI skelnede, bruges til at oprette kunstige proteiner af utrolig kompleksitet og variation. Som Ranganathan forklarede til EurekaAlert:
“Begrænsningerne er meget mindre, end vi nogensinde havde forestillet os, de ville være. Der er en simpelhed i naturens designregler, og vi tror, at lignende tilgange kan hjælpe os med at søge efter modeller for design i andre komplekse systemer i biologien, som økosystemer eller hjernen.”
Ranganathan og medarbejdere ønsker at tage deres modeller og generalisere dem, oprette en platform, som videnskabsfolk kan bruge til bedre at forstå, hvordan proteiner er konstrueret og hvilke effekter de har. De håber at bruge deres AI-systemer til at enable andre videnskabsfolk til at opdage proteiner, der kan tackle vigtige problemer som klimaforandringer. Ranganathan og associate professor Andrew Ferguson har oprettet et firma kaldet Evozyne, der har til formål at commercialisere teknologien og fremme dens brug i felter som landbrug, energi og miljø.
At forstå fællesnævnere mellem proteiner og relationerne mellem struktur og funktion kan også hjælpe med at oprette nye lægemidler og former for terapi. Selv om protein-folding har længe været betragtet som et utrolig svært problem for computere at knække, kan indsigt fra modeller som den, der er produceret af Ranganathans hold, hjælpe med at øge hastigheden af disse beregninger, hvilket kan facilitere oprettelsen af nye lægemidler baseret på disse proteiner. Lægemidler kan udvikles, der blokerer oprettelsen af proteiner i virus, potentiel hjælp i behandlingen af selv nye virus som Covid-19 koronavirus.
Ranganathan og resten af forskningsholdet skal stadig forstå, hvordan og hvorfor deres modeller fungerer og hvordan de producerer pålidelige protein-tegninger. Forskningsholdets næste mål er at bedre forstå, hvilke attributter modellerne tager i betragtning for at nå til deres konklusioner.










