výhonek Umělá inteligence používaná k identifikaci sekvencí aktivace genů a nalezení genů způsobujících onemocnění - Unite.AI
Spojte se s námi

Zdravotní péče

AI používaná k identifikaci sekvencí aktivace genů a nalezení genů způsobujících onemocnění

mm
aktualizováno on

Umělá inteligence hraje ve vědě genomiky každým dnem větší roli. Nedávno tým výzkumníků z UC San Diego využil AI k objevení kódu DNA, který by mohl připravit cestu pro řízení aktivace genů. Kromě toho výzkumníci z australské národní vědecké organizace CSIRO použili algoritmy umělé inteligence k analýze více než jednoho bilionu genetických datových bodů, čímž zlepšili naše chápání lidského genomu a prostřednictvím lokalizace specifických genů způsobujících onemocnění.

Lidský genom a veškerá DNA obsahuje čtyři různé chemické báze: adenin, guanin, thymin a cytosin, zkráceně A, G, T a C. Tyto čtyři báze jsou spojeny dohromady v různých kombinacích, které kódují různé geny. Přibližně jedna čtvrtina všech lidských genů je kódována genetickými sekvencemi, které jsou zhruba TATAAA, s malými odchylkami. Tyto deriváty TATAAA zahrnují „TATA box”, nekódující sekvence DNA, které hrají roli při inicializaci transkripce pro geny složené z TATA. .

Jak informoval ScienceDaily, vědcům z UCSD se podařilo identifikovat aktivační kód DNA, který se používá stejně často jako aktivace TATA boxu, díky použití umělé inteligence. Vědci označují aktivační kód DNA jako „downstream core promotor region“ (DPR). Podle hlavního autora článku, který podrobně popisuje zjištění, profesora biologických věd UCSD Jamese Kagonaga, objev DPR odhaluje, jak je aktivována jedna čtvrtina až jedna třetina našich genů.

Kadonaga původně objevil sekvenci aktivace genu odpovídající částem DPR při práci s ovocnými muškami v roce 1996. Od té doby Kadonaga a kolegové pracovali na stanovení, které sekvence DNA korelovaly s aktivitou DPR. Výzkumný tým začal vytvořením půl milionu různých sekvencí DNA a určením, které sekvence vykazovaly aktivitu DPR. Přibližně 200,000 XNUMX sekvencí DNA bylo použito k trénování modelu umělé inteligence, který by mohl předpovědět, zda bude či nebude svědkem aktivity DPR v kouscích lidské DNA. Model byl údajně velmi přesný. Kadonaga popsal výkon modelu jako „absurdně dobrý“ a jeho prediktivní schopnost „neuvěřitelnou“. Proces použitý k vytvoření modelu se ukázal tak spolehlivý, že výzkumníci nakonec vytvořili podobnou AI zaměřenou na objevování nových výskytů TATA boxů.

V budoucnu by umělá inteligence mohla být využita k analýze vzorců sekvencí DNA a poskytnout výzkumníkům více informací o tom, jak probíhá aktivace genů v lidských buňkách. Kadonaga věří, že podobně jako umělá inteligence dokázala pomoci jeho týmu výzkumníků identifikovat DPR, AI také pomůže dalším vědcům při objevování důležitých sekvencí a struktur DNA.

V dalším použití AI k prozkoumání lidského genomu, jak uvádí MedicalExpress, výzkumníci z australské národní vědecké agentury CSIRO použili platformu AI nazvanou VariantSpark k analýze více než 1 bilionu bodů genomických dat. Doufáme, že výzkum založený na umělé inteligenci pomůže vědcům určit umístění určitých genů souvisejících s nemocí.

Tradiční metody analýzy genetických vlastností mohou trvat roky, než se dokončí, ale jak vysvětlil vedoucí bioinformatiky CSIRO Dr. Denis Bauser, AI má potenciál tento proces dramaticky urychlit. VarianSpark je platforma AI, která dokáže analyzovat vlastnosti, jako je náchylnost k určitým chorobám, a určit, které geny je mohou ovlivnit. Bauer a další výzkumníci využili VariantSpark k analýze syntetického souboru dat přibližně 100,000 15 jedinců za pouhých XNUMX hodin. VariantSpark analyzoval více než deset milionů variant jednoho bilionu genomických datových bodů, což je úkol, který by i těm nejrychlejším konkurentům s tradičními metodami trval tisíce let.

Jak vysvětlil Dr. David Hansin, generální ředitel CSIRO Australian E-Health Research Center přes MedicalExpress:

"Navzdory nedávným technologickým průlomům se studiemi sekvenování celého genomu je molekulární a genetický původ komplexních onemocnění stále nedostatečně pochopen, což ztěžuje predikci, aplikaci vhodných preventivních opatření a personalizovanou léčbu."

Bauer věří, že VariantSpark lze škálovat až na datové soubory na úrovni populace a pomoci určit, jakou roli hrají geny při rozvoji kardiovaskulárních onemocnění a neuronových onemocnění. Taková práce by mohla vést k včasnému zásahu, personalizované léčbě a obecně lepším zdravotním výsledkům.