škrbina Umjetna inteligencija koja se koristi za identifikaciju sekvenci aktivacije gena i pronalaženje gena koji uzrokuju bolesti - Unite.AI
Povežite se s nama

Zdravstvo

AI koja se koristi za identifikaciju sekvenci aktivacije gena i pronalaženje gena koji uzrokuju bolesti

mm
Ažurirano on

Umjetna inteligencija svakim danom igra sve veću ulogu u znanosti o genomici. Nedavno je tim istraživača s UC San Diega upotrijebio umjetnu inteligenciju kako bi otkrio DNK kod koji bi mogao otvoriti put kontroli aktivacije gena. Osim toga, istraživači iz australske nacionalne znanstvene organizacije, CSIRO, upotrijebili su algoritme umjetne inteligencije za analizu više od jednog trilijuna genetskih podatkovnih točaka, unapređujući naše razumijevanje ljudskog genoma i kroz lokalizaciju specifičnih gena koji uzrokuju bolesti.

Ljudski genom i sva DNK sastoji se od četiri različite kemijske baze: adenin, gvanin, timin i citozin, skraćeno A, G, T i C. Ove četiri baze spojene su u različite kombinacije koje kodiraju različite gene. Otprilike jedna četvrtina svih ljudskih gena kodirana je genetskim sekvencama koje su otprilike TATAAA, s malim varijacijama. Ovi TATAAA derivati ​​sastoje se od "TATA kutija”, nekodirajuće sekvence DNA koje igraju ulogu u pokretanju transkripcije za gene koji se sastoje od TATA.. Međutim, nije poznato kako se ostalih približno 75% ljudskog genoma aktivira, zahvaljujući ogromnom broju mogućih kombinacija sekvenci baza .

Kako javlja ScienceDaily, istraživači s UCSD-a uspjeli su identificirati DNK aktivacijski kod koji se koristi jednako često kao i aktivacije TATA kutije, zahvaljujući njihovoj upotrebi umjetne inteligencije. Istraživači nazivaju DNK aktivacijski kod "nizvodnom jezgrenom promotorskom regijom" (DPR). Prema starijem autoru rada koji detaljno opisuje nalaze, profesoru bioloških znanosti UCSD-a Jamesu Kagonagi, otkriće DPR-a otkriva kako se negdje između jedne četvrtine do jedne trećine naših gena aktivira.

Kadonaga je prvobitno otkrio sekvencu aktivacije gena koja odgovara dijelovima DPR-a kada je radio s vinskim mušicama 1996. Od tada, Kadonaga i kolege rade na određivanju koje su sekvence DNK bile u korelaciji s aktivnošću DPR-a. Istraživački tim započeo je stvaranjem pola milijuna različitih sekvenci DNK i utvrđivanjem koje sekvence pokazuju DPR aktivnost. Oko 200,000 sekvenci DNK korišteno je za treniranje modela umjetne inteligencije koji je mogao predvidjeti hoće li se DPR aktivnost vidjeti unutar dijelova ljudske DNK. Model je navodno bio vrlo precizan. Kadonaga je performanse modela opisao kao "apsurdno dobre", a njegovu moć predviđanja "nevjerojatnu". Proces korišten za izradu modela pokazao se toliko pouzdanim da su istraživači na kraju stvorili sličnu umjetnu inteligenciju usmjerenu na otkrivanje novih pojavljivanja TATA kutija.

U budućnosti bi se umjetna inteligencija mogla iskoristiti za analizu uzoraka sekvenci DNK i dati istraživačima bolji uvid u to kako se aktivacija gena događa u ljudskim stanicama. Kadonaga vjeruje da će, slično kao što je umjetna inteligencija mogla pomoći njegovom timu istraživača identificirati DPR, AI pomoći drugim znanstvenicima u otkrivanju važnih sekvenci i struktura DNK.

U drugom korištenju umjetne inteligencije za istraživanje ljudskog genoma, kako izvještava MedicalExpress, istraživači iz australske nacionalne znanstvene agencije CSIRO upotrijebili su AI platformu pod nazivom VariantSpark kako bi analizirali preko 1 trilijun točaka genomskih podataka. Nadamo se da će istraživanje temeljeno na umjetnoj inteligenciji pomoći znanstvenicima da odrede lokaciju određenih gena povezanih s bolestima.

Tradicionalne metode analize genetskih svojstava mogu potrajati godinama, ali kako je objasnio voditelj CSIRO Bioinformatics dr. Denis Bauser, umjetna inteligencija ima potencijal dramatično ubrzati ovaj proces. VarianSpark je AI platforma koja može analizirati osobine kao što je osjetljivost na određene bolesti i odrediti koji geni mogu utjecati na njih. Bauer i drugi istraživači upotrijebili su VariantSpark za analizu sintetičkog skupa podataka od oko 100,000 pojedinaca u samo 15 sati. VariantSpark je analizirao više od deset milijuna varijanti jednog trilijuna genomskih podatkovnih točaka, što je zadatak za koji bi čak i najbržim natjecateljima koji koriste tradicionalne metode trebale tisuće godina.

Kako je objasnio dr. David Hansin, izvršni direktor CSIRO australskog istraživačkog centra za e-zdravlje preko MedicalExpressa:

"Unatoč nedavnim tehnološkim otkrićima sa studijama sekvenciranja cijelog genoma, molekularno i genetsko podrijetlo složenih bolesti još uvijek se slabo razumije što otežava predviđanje, primjenu odgovarajućih preventivnih mjera i personalizirano liječenje."

Bauer vjeruje da se VariantSpark može povećati na skupove podataka na razini populacije i pomoći u određivanju uloge koju geni igraju u razvoju kardiovaskularnih bolesti i bolesti neurona. Takav bi rad mogao dovesti do rane intervencije, personaliziranih tretmana i općenito boljih zdravstvenih ishoda.