Inteligență artificială

DeepMind Poised To Transform Biological Sciences By Solving Protein Folding Problem

mm

Divizia de inteligență artificială a Google, DeepMind, a făcut recent progrese semnificative în direcția rezolvării uneia dintre cele mai vechi provocări din biologie, calcularea formei unei proteine dintr-o secvență de aminoacizi. Conform Nature, această descoperire are potențialul de a transforma domeniile biologiei și chimiei, permițând oamenilor de știință să determine funcția multor proteine care sunt în prezent misterioase.

Forma unei proteine definește funcția sa, iar majoritatea funcțiilor biologice depind de proteine. “Împăturirea proteinelor” este numele dat procesului care transformă lanțurile de aminoacizi în structuri tridimensionale pe care proteinele le necesită pentru a-și îndeplini funcțiile. Dacă oamenii de știință pot determina relația dintre secvențele de aminoacizi și forma proteinelor pe care le generează, pot determina care proteine afectează diferite procese biologice.

Oamenii de știință ipotezează că există cel puțin 80.000 de proteine în proteomul uman, dar doar o fracțiune mică din aceste proteine au structuri cunoscute. Metoda tradițională de determinare a formei unei proteine poate dura ani de experimente de laborator, chiar și cu puterea algoritmilor și modelelor de știință computerizată. Lucrarea efectuată de DeepMind poate accelera dramatic procesul de descoperire a structurilor proteinelor, determinând în mod fiabil structura proteinelor într-o fracțiune din timpul normal.

Cercetătorii de la DeepMind și-au antrenat algoritmii pe o bază de date cuprinzând aproximativ 170.000 de secvențe de proteine și formele corespunzătoare cu aceste secvențe. Algoritmii dezvoltați de cercetători au fost antrenați pe 100 până la 200 de unități de procesare grafică (GPU) și procesul de antrenare a durat câteva săptămâni. Modelul dezvoltat de cercetători a fost numit “AlphaFold”.

AlphaFold funcționează printr-un “algoritm de tensiune”, începând prin conectarea unor piese mici ale proteinei și apoi mărindu-le pentru a conecta secțiuni mai mari și mai mari. Clustere mici de aminoacizi au fost legate la început, iar apoi algoritmul a căutat modalități de a lega aceste clustere.

Cercetătorii AlphaFold au încercat inițial să utilizeze algoritmi de învățare profundă convenționali pe date genetice și structurale pentru a prezice relația dintre aminoacizi și proteine. AlphaFold a creat apoi modele de consens pentru stilul proteinelor. Când această tehnică s-a dovedit a avea prea multe limitări, cercetătorii au încercat o nouă strategie. Echipa de cercetare AlphaFold a creat modele antrenate pe mai multe caracteristici și de data aceasta modelul a returnat predicții pentru structura finală a secvențelor de proteine.

Echipa de ingineri a testat AlphaFold introducându-l într-o competiție în care algoritmii computerului concurează pentru a evalua structura unei proteine din secvențe de aminoacizi. Competiția a fost “Evaluarea critică a prezicerii structurii proteinelor” sau CASP. Participanții la competiție primesc 100 de secvențe de aminoacizi și modelele lor trebuie să determine structura proteinelor. Nu numai că AlphaFold a depășit celelalte modele de computer în ceea ce privește acuratețea, dar a performant și comparabil cu tehnicile de modelare tradiționale, bazate pe laborator. Scorul median final al lui AlphaFold a fost de aproximativ 92 din 100, cu metodele experimentale bazate pe laborator care au primit un scor de 90. Scorul median al lui AlphaFold a scăzut la 87 la proteinele cele mai dificile.

Conform lui Demis Hassabis, directorul general și co-fondator al DeepMind, compania face deja planuri pentru a oferi cercetătorilor acces la AlphaFold, iar oamenii de știință de la Institutul Max Planck pentru Biologie a Dezvoltării folosesc deja modelul pentru a descoperi structuri de proteine pe care le-au studiat timp de peste un deceniu.

Janet Thornton, directorul emerit al Institutului European de Bioinformatică, a fost citat de ScienceMag spunând că realizările lui DeepMind “vor schimba viitorul biologiei structurale și al cercetării proteinelor”. Între timp, biologul de la Universitatea din Maryland, Shady Grove, John Moult spune că nu a crezut niciodată că problema împăturirii proteinelor va fi rezolvată în această viață.

Deși AlphaFold este foarte puțin probabil să înlocuiască complet metodele experimentale tradiționale de descoperire a structurilor proteinelor, poate crește dramatic viteza cu care structurile proteinelor sunt descoperite. Cercetătorii pot avea nevoie de mai puține date experimentale de înaltă calitate pentru a determina structura unei proteine și cercetătorii au deja acces la o cantitate mare de date genomice care pot fi traduse în structuri utilizând soluțiile lui AlphaFold.

Blogger și programator cu specializări în Machine Learning și Deep Learning subiecte. Daniel speră să ajute pe alții să folosească puterea inteligenței artificiale pentru binele social.