Terveydenhuolto

Google DeepMind julkaisi AlphaGenomen ihmisen genomin toiminnan koodaamiseksi

mm

Google DeepMind julkaisi 28. tammikuuta AlphaGenomen, tekoälymallin, joka ennustaa, miten DNA-jaksot kääntyvät biologisiksi toiminnoksi, prosessoiden jopa miljoona emäsparia kerralla ja ylittäen olemassa olevat mallit 25:stä 26:sta variantin vaikutuksen ennustamisen vertailukohteesta.

Malli, joka on julkaistu Naturessa ja yksityiskohtaisesti DeepMindin blogissa, edustaa merkittävää edistystaskua laskennallisen genomiikan alalla. Siinä, missä aiemmat mallit vaativat erillisiä järjestelmiä eri ennustustehtävien suorittamiseen, AlphaGenome käsittelee kaiken aina geeni-ilmaisusta kromatiinin saatavuuteen yhden yhdistetyn arkkitehtuurin avulla.

“AlphaGenome voi tarkastella pitkää DNA-jaksoa ja ennustaa, missä kriittiset säätelyelementit sijaitsevat ja mitkä ovat niiden vaikutukset geeni-ilmaisuun”, DeepMind-tiimi kirjoitti ilmoituksessaan. Mallin miljoona tokenin kontekstiruutu mahdollistaa sen, että se voi havaita kaukoetäisyydellä olevien DNA-alueiden väliset vuorovaikutukset, jotka vaikuttavat siihen, miten geenejä käännetään päälle ja pois.

Miten se toimii

AlphaGenome yhdistää kaksi neurverkkoarkkitehtuuria: Borzoi-tyylisen 1D-konvoluution verkon raakojen DNA-jaksojen prosessointiin ja U-Net-arkkitehtuurin, joka on sovellettu kuvien segmentoinnista. Tämä hybridiratkaisu mahdollistaa mallin käsittelemisen sekä DNA-jaksojen peräkkäistä luonnetta että säätelyelementtien välisiä monimutkaisia suhteita.

Koulutusdata kattaa noin 7 000 genominuria ENCODE- ja FANTOM-konsortioista – massiivisista yhteistyöhankkeista, jotka ovat katalogineet toiminnalliset elementit ihmisen genomin yli. Malli oppii ennustamaan signaaleja kokeellisista tutkimuksista, jotka mitataan geeni-ilmaisun, DNA-saatavuuden, proteiinien sitoutumisen ja kromatiinin muutosten avulla.

Tutkijoille käytännön arvo on variantin vaikutuksen ennustamisessa. Kun potilaan genomi sisältää mutaation, kliinikot tarvitsevat tietää, onko variantti merkityksellinen. AlphaGenome voi ennustaa, miten yksittäinen nukleotidi muutos vaikuttaa koko säätelymaisemaan, mahdollisesti merkittyä sairautta aiheuttavia variantteja, joita nykyiset menetelmät eivät havaitse.

Malli saavutti vahvat tulokset vertailuissa, jotka testasivat sen kykyä ennustaa, miten geneettiset variantit vaikuttavat geeni-ilmaisuun ja säätelyelementtien toimintaan. Ilmaisuun määrityslohkojen (eQTL) – varianttien, jotka tunnetaan vaikuttavan geeni-ilmaisuun – osalta AlphaGenome vastasi tai ylitti erikoistuneita malleja, jotka oli koulutettu nimenomaan näihin tehtäviin.

Avoin lähdekoodi

DeepMind julkaisi AlphaGenomen lähdekoodin GitHubissa ei-kaupalliseen käyttöön, jatkamalla laboratorion käytäntöä perusbiologian työkalujen julkaisemisesta yleisesti saataville. Repositorio sisältää mallipainot, inference-koodin ja dokumentaation ennustusten suorittamiseen mukautettujen jaksojen kanssa.

Avoin julkaisu noudattaa AlphaFoldin mallia, DeepMindin proteiinirakenteen ennustusvälineen, jota yli 3 miljoonaa tutkijaa on käyttänyt sen julkaisemisesta vuonna 2021. AlphaGenome käsittelee täydentävää ongelmaa: kun AlphaFold ennustaa, miltä proteiinit näyttävät, AlphaGenome ennustaa, milloin ja missä geenit tuottavat näitä proteiineja.

Google DeepMindin toimitusjohtaja Demis Hassabis on asettanut biologian yhdeksi tärkeimmistä sovellusalueista laboratorion tekoälykyvyille. Genomiikan työ laajentaa DeepMindin tavoitteita vuorovaikutteisen älypuhelimen ja kielen mallien ulkopuolelle, jotka voimassa olevat tuotteet kuten Gemini, soveltamalla samanlaisia arkkitehtuurin innovaatioita tieteellisiin ongelmiin.

Miksi tämä on tärkeää

Ihmisen genomi sisältää noin 3 miljardia emäsparia, mutta vain noin 1,5 % koodaa suoraan proteiineja. Loput 98,5 % – “jäte-DNA” – sisältää säätelyelementtejä, jotka ohjaavat, milloin, missä ja kuinka paljon geenejä ilmenee. Mutatiodet näissä ei-koodaavissa alueissa aiheuttavat sairauksia, mutta määrittäminen, mitkä variantit ovat merkityksellisiä, on ollut erittäin vaikeaa.

Perinteiset menetelmät vaativat kalliita, aikaa vieviä kokeita yksittäisten varianttien testaamiseen. Tekoälymallit kuten AlphaGenome voivat skannata tuhansia variantteja laskemallisesti, priorisoiden, mitkä niistä ansaitsevat kokeellisen seurannan. Harvinaisten sairauksien diagnosoinnissa, joissa potilaat usein kantavat uusia variantteja, joiden vaikutukset ovat tuntemattomia, tämä kyky voisi kiihdyttää polkua sekvensoinnista diagnosoihin.

Mallin kyky prosessoida miljoonan emäsparin konteksteja on erityisen merkittävää. Geenin säätelyelementit voivat sijaita satoja tuhansia emäsparia pois geeneistä, joita ne ohjaavat, viestien kompleksisten 3D-kietoutumisten kautta. Aikaisemmat mallit, joilla oli lyhyemmät kontekstiruudut, eivät voineet havaita näitä etäisiä riippuvuuksia.

AlphaGenome liittyy kasvavaan ekosysteemiin tekoälytyökaluista, jotka muokkaavat biologian tutkimusta. Proteiinirakenteen ennustaminen, lääkekehitys ja nyt geenien säätely ovat yhä enemmän ratkaistavissa tekoälylle. Genetiikan tutkimusyhteisölle näiden mallien avoin saatavuus demokratisoi pääsyn laskennallisiin kykyihin, jotka aiemmin olivat rajoitettu hyvin rahoitettuihin laboratorioihin.

Mallin rajoitukset ovat myös selvät DeepMindin esittelyssä. Vaikka AlphaGenome on erinomainen ennustamaan kokeellisia mittauksia, niiden ennustusten kääntäminen kliinisiin tuloksiin vaatii lisävalidointia. Ero ennustetun kromatiinin saatavuuden ja sairauden riskin välillä on edelleen merkittävä.

AlphaGenome toimii tutkimustyökaluna, joka voi kiihdyttää ymmärrystä siitä, miten genomi toimii, vaikka kliiniset sovellukset ovat vielä vuosia etäällä. 3 000 tutkijaa 160 maassa, jotka jo käyttävät mallia, osoittavat, että tutkimusyhteisö näkee välittömän arvon siinä, mitä DeepMind on rakentanut.

Alex McFarland on AI-toimittaja ja kirjailija, joka tutkii viimeisimpiä kehityksiä tekoälyssä. Hän on tehnyt yhteistyötä useiden AI-startup-yritysten ja julkaisujen kanssa maailmanlaajuisesti.