stomp AI-onderzoekers ontwikkelen een verklaarbaar neuraal netwerk om genomische regels te ontdekken - Unite.AI
Verbind je met ons

Artificial Intelligence

AI-onderzoekers ontwikkelen een verklaarbaar neuraal netwerk om genomische regels te ontdekken

mm
Bijgewerkt on

Een team van onderzoekers heeft onlangs creëerde een verklaarbaar neuraal netwerk bedoeld om biologen te helpen de mysterieuze regels te ontdekken die de code van het menselijk genoom bepalen. Het onderzoeksteam trainde een neuraal netwerk op kaarten van eiwit-DNA-interacties, waardoor de AI kon ontdekken hoe bepaalde DNA-sequenties bepaalde genen reguleren. De onderzoekers maakten het model ook verklaarbaar, zodat ze de conclusies van het model konden analyseren en konden bepalen hoe sequentiemotieven genen reguleren.

Een van de grote mysteries in de biologie is de regulerende code van het genoom. Het is bekend dat DNA bestaat uit vier nucleotidebasen - Adenine, Guanine, Thymine en Cytosine - maar het is niet bekend hoe deze basenparen worden gebruikt om activiteit te reguleren. De vier nucleotidebasen coderen voor de instructies voor het bouwen van eiwitten, maar ze bepalen ook waar en hoe genen tot expressie worden gebracht (hoe ze eiwitten maken in een organisme). Bepaalde combinaties en rangschikkingen van de basen creëren secties van regulerende code die zich binden aan DNA-segmenten, en het is onbekend wat deze combinaties precies zijn.

Een interdisciplinair team van computerwetenschappers en biologen trachtte dit mysterie op te lossen door een verklaarbaar neuraal netwerk te creëren. Het onderzoeksteam creëerde een neuraal netwerk dat ze "Base Pair Network" of "BPNet" noemden. Het model dat door BPNet wordt gebruikt om voorspellingen te genereren, kan worden geïnterpreteerd om regelgevingscodes te identificeren. Dit werd bereikt door te voorspellen hoe eiwitten die transcriptiefactoren worden genoemd zich binden aan DNA-sequenties.

De onderzoekers voerden een verscheidenheid aan experimenten uit en deden uitgebreide computermodellering om te bepalen hoe transcriptiefactoren en DNA aan elkaar waren gebonden, en ontwikkelden een gedetailleerde kaart tot op het niveau van individuele nucleotidebasen. De gedetailleerde transcriptiefactor-DNA-representaties stelden de onderzoekers in staat tools te creëren die in staat zijn om zowel kritische DNA-sequentiepatronen als de regels die functioneren als regelgevende code te interpreteren.

Julia Zeitlinger, PhD-bioloog en computationeel onderzoeker aan de Stanford University, legde uit dat de resultaten van het verklaarbare neurale netwerk overeenkwamen met bestaande experimentele resultaten, maar ze bevatten ook verrassende inzichten in de regulerende code van het genoom. Dankzij het AI-model kon het onderzoeksteam bijvoorbeeld een regel ontdekken die van invloed is op de werking van een transcriptiefactor genaamd Nanog. Wanneer meerdere exemplaren van het Nanog-motief aanwezig zijn aan dezelfde kant van een dubbele DNA-helix, binden ze coöperatief aan het DNA. Zoals Zeitlinger uitlegde via ScienceDaily:

“Er is een lang spoor van experimenteel bewijs dat een dergelijke motiefperiodiciteit soms bestaat in de regelgevingscode. De exacte omstandigheden waren echter ongrijpbaar en Nanog was geen verdachte geweest. Het was verrassend om te ontdekken dat Nanog zo'n patroon heeft en aanvullende details van zijn interacties te zien, omdat we niet specifiek naar dit patroon hebben gezocht."

De recent onderzoekspaper is verre van de eerste studie die AI gebruikt om DNA te analyseren, maar het is waarschijnlijk de eerste studie die de "zwarte doos" van AI opent om te onderscheiden welke DNA-sequenties genen in het genoom reguleren. Neurale netwerken blinken uit in vindpatronen binnen data, maar hun inzichten zijn moeilijk te extraheren uit de modellen die ze maken. Door een methode te creëren om te analyseren welke kenmerken het model belangrijk vindt voor de voorspelling van genomische regels, kunnen de onderzoekers meer genuanceerde modellen trainen die tot nieuwe ontdekkingen leiden.

De architectuur van BPNet is vergelijkbaar met netwerken die worden gebruikt om gezichten in afbeeldingen te herkennen. Wanneer computervisiesystemen gezichten in afbeeldingen herkennen, begint het netwerk met het detecteren van randen en verbindt deze vervolgens met elkaar. Het verschil is dat BPNet leert van DNA-sequenties, sequentiemotieven detecteert en deze motieven samenvoegt tot regels van hogere orde die kunnen worden gebruikt om de binding van gegevens met de basisresolutie te voorspellen.

Nadat het model een hoge nauwkeurigheidsdrempel heeft bereikt, worden de door het model geleerde patronen herleid tot de oorspronkelijke invoerreeksen, waardoor de reeksmotieven worden onthuld. Ten slotte is het model voorzien van systematische DNA-sequentiequery's, waardoor de onderzoekers de regels begrijpen waarmee sequentiemotieven combineren en functioneren. Volgens Zeitlinger is het model in staat veel meer sequenties te voorspellen dan de onderzoekers op een traditionele, experimentele manier zouden kunnen testen. Door de uitkomst van experimentele anomalieën te voorspellen, konden de onderzoekers bovendien vaststellen welke experimenten het meest informatief waren bij het valideren van het model.

Blogger en programmeur met specialiteiten in Machine leren en Diepe leren onderwerpen. Daniel hoopt anderen te helpen de kracht van AI te gebruiken voor maatschappelijk welzijn.