stubbur Vísindamenn gervigreindar þróa útskýranlegt tauganet til að uppgötva erfðafræðilegar reglur - Unite.AI
Tengja við okkur

Artificial Intelligence

Vísindamenn gervigreindar þróa skýranlegt tauganet til að uppgötva erfðafræðilegar reglur

mm
Uppfært on

Hópur vísindamanna hefur sl búið til útskýranlegt tauganet ætlað að aðstoða líffræðinga við að afhjúpa þær dularfullu reglur sem gilda um kóða erfðamengis mannsins. Rannsóknarteymið þjálfaði taugakerfi á kortum af prótein-DNA samskiptum, sem gerði gervigreindinni kleift að uppgötva hvernig ákveðnar DNA raðir stjórna tilteknum genum. Rannsakendur gerðu líkanið útskýranlegt, þannig að þeir gætu greint niðurstöður líkansins og ákvarðað hvernig á að raðgreina mótíf stjórna genum.

Einn af stóru leyndardómunum í líffræði er regluverk erfðamengisins. Það er vitað að DNA samanstendur af fjórum núkleótíðbösum - adeníni, gúaníni, týmíni og cýtósíni - en það er ekki vitað hvernig þessi basapör eru notuð til að stjórna virkni. Núkleótíðbasarnir fjórir kóða leiðbeiningar um byggingu próteina, en þeir stjórna líka hvar og hvernig gen eru tjáð, (hvernig þeir búa til prótein í lífveru). Sérstakar samsetningar og fyrirkomulag basanna búa til hluta af reglugerðarkóða sem bindast DNA-hlutum og það er ekki vitað hverjar þessar samsetningar eru.

Þverfaglegt teymi tölvunarfræðinga og líffræðinga lagði sig fram um að leysa þessa ráðgátu með því að búa til útskýranlegt tauganet. Rannsóknarteymið bjó til tauganet sem þeir kölluðu „Base Pair Network“ eða „BPNet“. Líkanið sem BPNet notar til að búa til spár er hægt að túlka til að bera kennsl á reglugerðarkóða. Þetta var gert með því að spá fyrir um hvernig prótein sem kallast umritunarþættir bindast DNA röðum.

Rannsakendur gerðu margvíslegar tilraunir og gerðu yfirgripsmikla tölvulíkön til að ákvarða hvernig umritunarþættir og DNA voru tengd saman og þróuðu ítarlegt kort niður að stigi einstakra núkleótíðbasa. Ítarlegar umritunarþættir-DNA framsetningar gera rannsakendum kleift að búa til verkfæri sem geta túlkað bæði mikilvæg DNA röð mynstur og reglurnar sem virka sem reglugerðarkóði.

Julia Zeitlinger, PhD líffræðingur og tölvunarfræðingur við Stanford háskóla, útskýrði að niðurstöðurnar sem safnað var úr útskýranlegu tauganeti tengdust núverandi tilraunaniðurstöðum, en þær innihéldu einnig óvænta innsýn í regluverk erfðamengisins. Sem dæmi gerði gervigreind líkanið rannsóknarhópnum kleift að uppgötva reglu sem hefur áhrif á hvernig umritunarþáttur sem kallast Nanog virkar. Þegar mörg tilvik af Nanog mótífinu eru til staðar á sömu hlið DNA tvöfaldrar helix, bindast þau í samvinnu við DNA. Eins og Zeitlinger útskýrði í gegnum ScienceDaily:

„Það hefur verið löng slóð af tilraunavísbendingum um að slík reglubundin mótíf sé stundum til í reglunum. Nákvæmar aðstæður voru hins vegar fáránlegar og Nanog hafði ekki verið grunaður. Að uppgötva að Nanog hefur slíkt mynstur, og sjá frekari upplýsingar um samskipti þess, kom á óvart vegna þess að við leituðum ekki sérstaklega að þessu mynstri.“

The nýleg rannsóknarritgerð er langt frá því að vera fyrsta rannsóknin sem notar gervigreind til að greina DNA, en það er líklega fyrsta rannsóknin sem opnar „svarta kassann“ gervigreindar til að greina hvaða DNA-raðir stjórna genum í erfðamenginu. Taugakerfi skara fram úr við að finna mynstur innan gagna, en innsýn þeirra er erfitt að draga úr líkönunum sem þau búa til. Með því að búa til aðferð til að greina hvaða eiginleika líkanið telur mikilvæga fyrir spá um erfðafræðilegar reglur gætu rannsakendur þjálfað blæbrigðaríkari líkön sem leiða til nýrra uppgötvana.

Arkitektúr BPNet er svipaður netkerfum sem notuð eru til að þekkja andlit á myndum. Þegar tölvusjónkerfi þekkja andlit á myndum byrjar netið á því að greina brúnir og sameinar síðan þessar brúnir. Munurinn er sá að BPNet lærir af DNA röðum, greinir mótíf í röð og sameinar þessi mótíf í hærri röð reglur sem hægt er að nota til að spá fyrir um bindingu gagna við grunnupplausn.

Eftir að líkanið hefur náð háum nákvæmniþröskuldi eru mynstrin sem líkanið lærði rakin til upprunalegu inntaksröðanna, sem sýnir röð mótífin. Að lokum er líkanið útbúið með kerfisbundnum DNA röð fyrirspurnum, sem gerir rannsakendum kleift að skilja reglurnar þar sem raðmyndir sameinast og virka. Samkvæmt Zeitlinger er líkanið fært um að spá fyrir um mun fleiri raðir en rannsakendur gætu gert sér vonir um að prófa á hefðbundinn, tilraunakenndan hátt. Að auki, með því að spá fyrir um niðurstöðu frávika í tilraunum, gerði það að verkum að rannsakendur gætu greint hvaða tilraunir voru upplýsandi þegar líkanið var staðfest.