Kunstig intelligens
Deep Learning bruges til at finde sygdomsrelaterede gener

A ny undersøgelse ledet af forskere ved Linköpings Universitet demonstrerer, hvordan et kunstigt neuralt netværk (ANN) kan afsløre store mængder genekspressionsdata, og det kan føre til opdagelsen af ​​grupper af sygdomsrelaterede gener. Undersøgelsen blev offentliggjort i Nature Communications, og forskerne ønsker, at metoden anvendes inden for præcisionsmedicin og individualiseret behandling.
Forskere er i øjeblikket ved at udvikle kort over biologiske netværk, der er baseret på, hvordan forskellige proteiner eller gener interagerer med hinanden. Den nye undersøgelse involverer brugen af ​​kunstig intelligens (AI) for at finde ud af, om biologiske netværk kan opdages ved brug af deep learning. Kunstige neurale netværk, som trænes af eksperimentelle data i processen med dyb læring, er i stand til at finde mønstre inden for enorme mængder af komplekse data. På grund af dette bruges de ofte i applikationer som billedgenkendelse. Selv med dets tilsyneladende enorme potentiale, har brugen af ​​denne maskinlæringsmetode været begrænset inden for biologisk forskning.
Sanjiv Dwivedi er postdoc ved Institut for Fysik, Kemi og Biologi (IFM) ved Linköpings Universitet.
"Vi har for første gang brugt deep learning til at finde sygdomsrelaterede gener. Dette er en meget effektiv metode til analyse af enorme mængder biologisk information, eller 'big data'," siger Dwivedi.
Forskerne stolede på en stor database med information om ekspressionsmønstrene for 20,000 gener i et stort antal mennesker. Det kunstige neurale netværk fik ikke at vide, hvilke genekspressionsmønstre der var fra mennesker med sygdomme, eller hvilke der var fra raske individer. AI-modellen blev derefter trænet til at finde mønstre for genekspression.
Et af mysterierne omkring maskinlæring er, at det i øjeblikket er umuligt at se, hvordan et kunstigt neuralt netværk når frem til sit endelige resultat. Det er kun muligt at se den information, der går ind, og den information, der produceres, men alt, hvad der sker derimellem, består af flere lag af matematisk bearbejdet information. Disse indre funktioner i et kunstigt neuralt netværk er endnu ikke i stand til at dechifreres. Forskerne ville vide, om der var nogen ligheder mellem design af det neurale netværk og de velkendte biologiske netværk.
Mike Gustafsson er lektor ved IFM og leder studiet.
"Da vi analyserede vores neurale netværk, viste det sig, at det første skjulte lag i høj grad repræsenterede interaktioner mellem forskellige proteiner. Dybere i modellen fandt vi derimod på det tredje niveau grupper af forskellige celletyper. Det er ekstremt interessant, at denne type biologisk relevant gruppering produceres automatisk, da vores netværk er startet fra uklassificerede genekspressionsdata," siger Gustafsson.
Forskerne ønskede så at vide, om deres genekspressionsmodel var i stand til at blive brugt til at bestemme, hvilke genekspressionsmønstre der er forbundet med sygdom, og hvilke der er normale. De var i stand til at bekræfte, at modellen kan opdage relative mønstre, der stemmer overens med biologiske mekanismer i kroppen. En anden opdagelse var, at det kunstige neurale netværk muligvis kunne opdage helt nye mønstre, da det var trænet med uklassificerede data. Forskerne vil nu undersøge hidtil ukendte mønstre, og om de er relevante inden for biologi.
"Vi mener, at nøglen til fremskridt på området er at forstå det neurale netværk. Dette kan lære os nye ting om biologiske sammenhænge, ​​såsom sygdomme, hvor mange faktorer interagerer. Og vi mener, at vores metode giver modeller, der er nemmere at generalisere, og som kan bruges til mange forskellige typer biologisk information,” siger Gustafsson.
Gennem samarbejder med medicinske forskere håber Gustafsson at kunne anvende metoden i præcisionsmedicin. Dette kan hjælpe med at bestemme, hvilke specifikke typer medicin patienter skal modtage.
Undersøgelsen blev økonomisk støttet af den svenske fond för strategisk forskning (SSF) og det svenske forskningsråd.