Umělá inteligence
Hluboké učení používané k nalezení genů souvisejících s nemocemi

A Nová studie vedená výzkumníky z Linköping University demonstruje, jak umělá neuronová síť (ANN) může odhalit velké množství dat o genové expresi a může to vést k objevu skupin genů souvisejících s nemocemi. Studie byla zveřejněna v Nature Communications, a vědci chtějí, aby byla metoda aplikována v rámci přesné medicíny a individualizované léčby.
Vědci v současné době vyvíjejí mapy biologických sítí, které jsou založeny na vzájemné interakci různých proteinů nebo genů. Nová studie zahrnuje použití umělé inteligence (AI) s cílem zjistit, zda lze biologické sítě objevit pomocí hlubokého učení. Umělé neuronové sítě, které jsou trénovány experimentálními daty v procesu hlubokého učení, jsou schopny najít vzory v obrovském množství komplexních dat. Z tohoto důvodu se často používají v aplikacích, jako je rozpoznávání obrazu. I přes svůj zdánlivě obrovský potenciál bylo použití této metody strojového učení v rámci biologického výzkumu omezené.
Sanjiv Dwivedi je postdoktorandem na katedře fyziky, chemie a biologie (IFM) na Linköping University.
„Poprvé jsme použili hluboké učení k nalezení genů souvisejících s nemocemi. Je to velmi účinná metoda pro analýzu obrovského množství biologických informací neboli ‚velkých dat‘,“ říká Dwivedi.
Vědci se spoléhali na rozsáhlou databázi s informacemi o vzorcích exprese 20,000 XNUMX genů u velkého počtu lidí. Umělé neuronové síti nebylo řečeno, které vzorce genové exprese pocházejí od lidí s nemocemi nebo které od zdravých jedinců. Model AI byl poté trénován k nalezení vzorců genové exprese.
Jednou ze záhad kolem strojového učení je, že v současné době není možné vidět, jak umělá neuronová síť dospěje ke svému konečnému výsledku. Je možné vidět pouze informace, které vstupují dovnitř a informace, které jsou produkovány, ale vše, co se děje mezi tím, se skládá z několika vrstev matematicky zpracovaných informací. Toto vnitřní fungování umělé neuronové sítě zatím není možné dešifrovat. Vědci chtěli vědět, zda existují nějaké podobnosti mezi návrhy neuronové sítě a známými biologickými sítěmi.
Mike Gustafsson je docentem na IFM a vede studii.
„Když jsme analyzovali naši neuronovou síť, ukázalo se, že první skrytá vrstva do značné míry reprezentovala interakce mezi různými proteiny. Hlouběji v modelu, na třetí úrovni, jsme naopak našli skupiny různých typů buněk. Je nesmírně zajímavé, že tento typ biologicky relevantního seskupení se vytváří automaticky, vzhledem k tomu, že naše síť vychází z neklasifikovaných dat o genové expresi,“ říká Gustafsson.
Vědci pak chtěli vědět, zda je jejich model genové exprese schopen použít k určení, které vzorce genové exprese jsou spojeny s onemocněním a které jsou normální. Podařilo se jim potvrdit, že model dokáže objevit relativní vzorce, které souhlasí s biologickými mechanismy v těle. Dalším objevem bylo, že umělá neuronová síť by mohla objevit zcela nové vzorce, protože byla trénována s neutajovanými daty. Vědci nyní budou zkoumat dříve neznámé vzorce a zda jsou relevantní v biologii.
„Věříme, že klíčem k pokroku v této oblasti je pochopení neuronové sítě. To nás může naučit nové věci o biologických souvislostech, jako jsou nemoci, při nichž se mnoho faktorů vzájemně ovlivňuje. A věříme, že naše metoda poskytuje modely, které se snáze zobecňují a které lze použít pro mnoho různých typů biologických informací,“ říká Gustafsson.
Prostřednictvím spolupráce s lékařskými výzkumníky Gustafsson doufá, že tuto metodu uplatní v přesné medicíně. To by mohlo pomoci určit, které konkrétní typy léků by pacienti měli dostávat.
Studii finančně podpořila Švédská nadace pro strategický výzkum (SSF) a Švédská rada pro výzkum.