Connect with us

Inteligență artificială

Cercetătorii AI dezvoltă o rețea neuronală explicabilă pentru a descoperi regulile genomice

mm

O echipă de cercetători a creat recent o rețea neuronală explicabilă destinată să ajute biologii să descopere regulile misterioase care guvernează codul genomului uman. Echipa de cercetare a instruit o rețea neuronală pe hărți de interacțiuni proteină-ADN, permițând IA să descopere cum anumite secvențe de ADN reglementează anumite gene. Cercetătorii au făcut, de asemenea, modelul explicabil, astfel încât să poată analiza concluziile modelului și să determine cum să secvențeze motivele care reglementează genele.

Una dintre marile mistere în biologie este codul regulamentar al genomului. Se știe că ADN-ul este format din patru baze nucleotidice – Adenină, Guanină, Timină și Citozină – dar nu se știe cum aceste perechi de baze sunt utilizate pentru a reglementa activitatea. Cele patru baze nucleotidice codifică instrucțiunile pentru construirea proteinelor, dar ele controlează și unde și cum sunt exprimate genele, (cum produc proteine într-un organism). Combinații și aranjamente specifice ale bazelor creează secțiuni de cod regulamentar care se leagă de segmente de ADN, și nu se știe ce sunt aceste combinații.

O echipă interdisciplinară de oameni de știință din domeniul calculatoarelor și biologiei a încercat să rezolve acest mister prin crearea unei rețele neuronale explicabile. Echipa de cercetare a creat o rețea neuronală pe care au numit-o “Rețea de perechi de baze” sau “BPNet”. Modelul utilizat de BPNet pentru a genera predicții poate fi interpretat pentru a identifica codurile regulamentare. Acest lucru a fost realizat prin predicția modului în care proteinele numite factori de transcripție se leagă de secvențe de ADN.

Cercetătorii au efectuat o varietate de experimente și au realizat modelări computerizate cuprinzătoare pentru a determina cum factorii de transcripție și ADN-ul sunt legați împreună, dezvoltând o hartă detaliată până la nivelul individual de baze nucleotidice. Reprezentările detaliate ale factorilor de transcripție-ADN au permis cercetătorilor să creeze unelte capabile să interpreteze atât modelele critice de secvențe de ADN, cât și regulile care funcționează ca cod regulamentar.

Julia Zeitlinger, biolog și cercetător computațional la Universitatea Stanford, a explicat că rezultatele obținute din rețeaua neuronală explicabilă s-au potrivit cu rezultatele experimentale existente, dar au conținut și insight-uri surprinzătoare cu privire la codul regulamentar al genomului. Ca exemplu, modelul IA a permis echipei de cercetare să descopere o regulă care influențează modul în care un factor de transcripție numit Nanog funcționează. Atunci când multiple instanțe ale motivului Nanog sunt prezente pe aceeași parte a unei duble helice de ADN, ele se leagă cooperativ de ADN. Așa cum a explicat Zeitlinger prin ScienceDaily:

“A existat o lungă serie de dovezi experimentale că o astfel de periodicitate a motivului uneori există în codul regulamentar. Cu toate acestea, circumstanțele exacte erau evazive, iar Nanog nu a fost un suspect. Descoperirea faptului că Nanog are un astfel de model și vederea unor detalii suplimentare ale interacțiunilor sale a fost surprinzătoare, deoarece nu am căutat în mod specific acest model.”

Articolul de cercetare recent este departe de a fi primul studiu care utilizează IA pentru a analiza ADN-ul, dar este probabil primul studiu care deschide “cutia neagră” a IA pentru a discerne care secvențe de ADN reglementează genele în genom. Rețelele neuronale excelează în găsirea modelelor în cadrul datelor, dar insight-urile lor sunt greu de extras din modelele pe care le creează. Prin crearea unei metode de analiză a caracteristicilor pe care modelul le consideră importante pentru predicția regulilor genomice, cercetătorii au putut antrena modele mai nuanțate care duc la descoperiri noi.

Arhitectura BPNet este similară cu rețelele utilizate pentru a recunoaște fețe în imagini. Atunci când sistemele de viziune computerizată recunosc fețe în imagini, rețeaua începe prin detectarea marginilor și apoi leagă aceste margini împreună. Diferența constă în faptul că BPNet învață din secvențe de ADN, detectând motive de secvențe și unind aceste motive în reguli de ordine superioară care pot fi utilizate pentru a prezice legarea datelor la rezoluția bazelor.

După ce modelul a atins un prag de acuratețe ridicat, modelele învățate de model sunt urmărite înapoi la secvențele de intrare originale, dezvăluind motivele de secvențe. În final, modelul este furnizat cu interogări sistematice de secvențe de ADN, permițând cercetătorilor să înțeleagă regulile prin care motivele de secvențe se combină și funcționează. Conform lui Zeitlinger, modelul este capabil să prezică multe mai multe secvențe decât cercetătorii ar putea spera să testeze într-un mod experimental tradițional. În plus, prezicerea rezultatului anomaliilor experimentale a permis cercetătorilor să identifice care experimente au fost cele mai informative atunci când au validat modelul.

Blogger și programator cu specializări în Machine Learning și Deep Learning subiecte. Daniel speră să ajute pe alții să folosească puterea inteligenței artificiale pentru binele social.