Sănătate
Google DeepMind prezintă AlphaGenome pentru decodificarea funcției genomului uman

Google DeepMind a lansat AlphaGenome pe 28 ianuarie, un model AI care prezice cum secvențele de ADN se traduc în funcții biologice, procesând până la un milion de perechi de baze simultan și depășind modelele existente în 25 din 26 de teste de predicție a efectului variantelor.
Modelul, publicat în Nature și detaliat pe blogul DeepMind, reprezintă o avansare semnificativă în genomics computațională. În timp ce modelele anterioare necesitau sisteme separate pentru diferite sarcini de predicție, AlphaGenome gestionează totul, de la expresia genică la accesibilitatea cromatinei, într-o singură arhitectură unificată.
“AlphaGenome poate examina o porțiune lungă de ADN și prezice unde sunt elementele regulatorii critice și efectele lor downstream asupra expresiei genice”, a scris echipa DeepMind în anunțul lor. Fereastra de context de un milion de tokenuri a modelului îi permite să capteze interacțiunile pe termen lung dintre regiunile de ADN îndepărtate care influențează modul în care genele sunt activate sau dezactivate.
Cum funcționează
AlphaGenome combină două arhitecturi de rețele neurale: o rețea convoluțională 1D de tip Borzoi pentru procesarea secvențelor brute de ADN și o arhitectură U-Net adaptată din segmentarea imaginilor. Acest abordaj hibrid permite modelului să gestioneze atât natura secvențială a ADN-ului, cât și relațiile spațiale complexe dintre elementele regulatorii.
Datele de antrenament acoperă aproximativ 7.000 de urme genomice din consorțiile ENCODE și FANTOM – eforturi colaborative masive care au catalogat elemente funcționale de-a lungul genomului uman. Modelul învață să prezică semnalele de la teste experimentale care măsoară expresia genică, accesibilitatea ADN-ului, legarea proteinelor și modificările cromatinei.
Pentru cercetători, valoarea practică constă în predicția efectului variantelor. Când genomul unui pacient conține o mutație, clinicienii trebuie să știe dacă acea variantă are importanță. AlphaGenome poate prezice cum o singură modificare a nucleotidului afectează întregul peisaj regulator, posibil marcând variante care cauzează boli pe care metodele actuale le ratează.
Modelul a obținut rezultate puternice în testele care au evaluat capacitatea sa de a prezice cum variantele genetice afectează expresia genică și activitatea elementelor regulatorii. La locurile quantitative de trait de expresie (eQTL) – variante cunoscute că afectează nivelurile de expresie genetică – AlphaGenome a egalat sau a depășit modelele specializate antrenate în mod specific pentru aceste sarcini.
Disponibilitate sursă deschisă
DeepMind a lansat codul sursă al lui AlphaGenome pe GitHub pentru utilizare non-comercială, continuând modelul laboratorului de a face disponibile public instrumentele fundamentale de biologie. Depozitul include greutăți de model, cod de inferență și documentație pentru rularea predicțiilor pe secvențe personalizate.
Lansarea deschisă urmează modelul stabilit de AlphaFold, instrumentul de predicție a structurii proteice al lui DeepMind, care a fost utilizat de peste 3 milioane de cercetători de la lansarea sa în 2021. AlphaGenome abordează o problemă complementară: în timp ce AlphaFold prezice cum arată proteinele, AlphaGenome prezice când și unde genele produc aceste proteine.
CEO-ul Google DeepMind, Demis Hassabis, a poziționat biologia ca un domeniu de aplicație principal pentru capacitățile de IA ale laboratorului. Lucrările de genomică extind ambițiile lui DeepMind dincolo de inteligența conversațională și modelele de limbaj care alimentează produse precum Gemini, aplicând inovații arhitecturale similare problemelor științifice.
De ce este important
Genomul uman conține aproximativ 3 miliarde de perechi de baze, dar doar aproximativ 1,5% codifică direct proteine. Restul de 98,5% – considerat anterior “ADN de gunoi” – conține elemente regulatorii care controlează când, unde și cât de mult sunt exprimate genele. Mutațiile din aceste regiuni non-codificatoare cauzează boli, dar identificarea variantelor care contează a fost extraordinar de dificilă.
Metodele tradiționale necesită experimente scumpe și care consumă timp pentru a testa variante individuale. Modelele de învățare automată, cum ar fi AlphaGenome, pot examina mii de variante în mod computațional, prioritizând care dintre ele merită urmărirea experimentală. Pentru diagnosticarea bolilor rare, unde pacienții adesea poartă variante noi cu efecte necunoscute, această capacitate poate accelera calea de la secvențiere la diagnostic.
Capacitatea modelului de a procesa contexte de un milion de perechi de baze este deosebit de semnificativă. Elementele regulatorii genice pot fi situate la sute de mii de perechi de baze distanță de genele pe care le controlează, comunicând prin împăturirea complexă 3D a ADN-ului. Modelele anterioare cu ferestre de context mai scurte nu puteau capta aceste dependențe pe termen lung.
AlphaGenome se alătură unui ecosistem în creștere de instrumente AI care transformă cercetarea biologică. Predicția structurii proteice, descoperirea de medicamente și acum reglarea genică sunt tot mai mult probleme tratabile pentru învățarea automată. Pentru comunitatea de cercetare genetică, disponibilitatea deschisă a acestor modele democratizează accesul la capacități computaționale care erau anterior limitate la laboratoare bine finanțate.
Limitările modelului sunt, de asemenea, clare din prezentarea lui DeepMind. În timp ce AlphaGenome excelează la predicția măsurătorilor experimentale, traducerea acestor predicții în rezultate clinice necesită o validare suplimentară. Decalajul dintre predicția accesibilității cromatinei și predicția riscului de boală rămâne substanțial.
Pentru moment, AlphaGenome servește ca un instrument de cercetare – unul care ar putea accelera înțelegerea modului în care funcționează genomul, chiar dacă aplicațiile clinice rămân la ani distanță. Cei 3.000 de oameni de știință din 160 de țări care deja folosesc modelul sugerează că comunitatea de cercetare vede o valoare imediată în ceea ce a construit DeepMind.












