кочан AI, използван за идентифициране на последователности на активиране на гени и намиране на гени, причиняващи заболявания - Unite.AI
Свържете се с нас

Здравеопазване

AI, използван за идентифициране на последователности на генно активиране и намиране на гени, причиняващи заболявания

mm
Обновено on

Изкуственият интелект играе все по-голяма роля в науката за геномиката всеки ден. Наскоро екип от изследователи от UC San Diego използва AI, за да открие ДНК код, който може да проправи пътя за контролиране на генното активиране. В допълнение, изследователи от националната научна организация на Австралия, CSIRO, използваха AI алгоритми, за да анализират над един трилион генетични точки от данни, напредвайки в разбирането ни за човешкия геном и чрез локализиране на специфични гени, причиняващи болести.

Човешкият геном и цялата ДНК се състои от четири различни химични бази: аденин, гуанин, тимин и цитозин, съкратени съответно като A, G, T и C. Тези четири бази са обединени в различни комбинации, които кодират различни гени. Около една четвърт от всички човешки гени са кодирани от генетични последователности, които са приблизително TATAAA, с леки вариации. Тези производни на TATAAA включват „Кутия TATA”, некодиращи ДНК последователности, които играят роля в инициализирането на транскрипцията за гени, съставени от TATA.. Не е известно как обаче се активират другите приблизително 75% от човешкия геном, благодарение на огромния брой възможни комбинации от базови последователности .

Както съобщава ScienceDaily, изследователи от UCSD са успели да идентифицират код за активиране на ДНК, който се използва толкова често, колкото активирането на кутията TATA, благодарение на използването на изкуствен интелект. Изследователите наричат ​​кода за активиране на ДНК „регион на промотора надолу по веригата“ (DPR). Според главния автор на статията, описваща констатациите, професорът по биологични науки на UCSD Джеймс Кагонага, откритието на DPR разкрива как някъде между една четвърт до една трета от нашите гени се активират.

Kadonaga първоначално открива последователност на генно активиране, съответстваща на части от DPR, когато работи с плодови мушици през 1996 г. Оттогава Kadonaga и колегите работят върху определянето кои ДНК последователности са свързани с активността на DPR. Изследователският екип започна, като създаде половин милион различни ДНК последователности и определи кои последователности показват DPR активност. Около 200,000 XNUMX ДНК последователности бяха използвани за обучение на AI модел, който можеше да предвиди дали активността на DPR ще бъде наблюдавана в рамките на части от човешка ДНК. Съобщава се, че моделът е много точен. Кадонага описа представянето на модела като „абсурдно добро“, а неговата предсказваща сила „невероятна“. Процесът, използван за създаване на модела, се оказа толкова надежден, че изследователите в крайна сметка създадоха подобен AI, фокусиран върху откриването на нови събития на TATA кутия.

В бъдеще изкуственият интелект може да се използва за анализиране на модели на ДНК последователности и да даде на изследователите по-добра представа за това как се случва генното активиране в човешките клетки. Kadonaga вярва, че подобно на начина, по който AI успя да помогне на неговия екип от изследователи да идентифицират DPR, AI също ще помогне на други учени при откриването на важни ДНК последователности и структури.

При друга употреба на AI за изследване на човешкия геном, както съобщава MedicalExpress, изследователи от австралийската национална научна агенция CSIRO са използвали AI платформа, наречена VariantSpark, за да анализират над 1 трилион точки геномни данни. Надяваме се, че базираното на AI изследване ще помогне на учените да определят местоположението на определени гени, свързани с болестта.

Завършването на традиционните методи за анализ на генетични черти може да отнеме години, но както обясни ръководителят на CSIRO Bioinformatics д-р Денис Баузер, AI има потенциала драстично да ускори този процес. VarianSpark е AI платформа, която може да анализира черти като чувствителност към определени заболявания и да определи кои гени могат да им повлияят. Бауер и други изследователи използваха VariantSpark, за да анализират синтетичен набор от данни от около 100,000 15 индивида само за XNUMX часа. VariantSpark анализира над десет милиона варианта на един трилион точки от геномни данни, задача, която би отнела хиляди години дори на най-бързите конкуренти, използващи традиционни методи.

Както обясни д-р Дейвид Хансин, главен изпълнителен директор на CSIRO Australian E-Health Research Center чрез MedicalExpress:

„Въпреки неотдавнашните технологични пробиви с проучвания за секвениране на целия геном, молекулярният и генетичният произход на сложните заболявания все още са слабо разбрани, което затруднява прогнозирането, прилагането на подходящи превантивни мерки и персонализираното лечение.“

Бауер вярва, че VariantSpark може да бъде мащабиран до набори от данни на ниво популация и да помогне да се определи ролята, която играят гените в развитието на сърдечно-съдови заболявания и невронни заболявания. Такава работа може да доведе до ранна намеса, персонализирани лечения и по-добри здравни резултати като цяло.