Connect with us

Исследователи ИИ разработали объяснимую нейронную сеть для открытия геномных правил

Искусственный интеллект

Исследователи ИИ разработали объяснимую нейронную сеть для открытия геномных правил

mm

Команда исследователей недавно создала объяснимую нейронную сеть, предназначенную для помощи биологам в раскрытии загадочных правил, которые управляют кодом человеческого генома. Команда исследователей обучила нейронную сеть на картах взаимодействия белок-ДНК, что позволило ИИ открыть, как определенные последовательности ДНК регулируют определенные гены. Исследователи также сделали модель объяснимой, чтобы они могли проанализировать выводы модели и определить, как мотивы последовательностей регулируют гены.

Одна из больших загадок в биологии – это регуляторный код генома. Известно, что ДНК состоит из четырех нуклеотидных оснований – аденина, гуанина, тимина и цитозина, – но неизвестно, как эти пары оснований используются для регуляции активности. Четыре нуклеотидных основания кодируют инструкции для построения белков, но они также контролируют, где и как гены выражаются, (как они производят белки в организме). Определенные комбинации и расположения оснований создают секции регуляторного кода, которые связываются с сегментами ДНК, и неизвестно, какие именно эти комбинации.

Междисциплинарная команда компьютерных ученых и биологов поставила цель решить эту загадку, создав объяснимую нейронную сеть. Команда исследователей создала нейронную сеть, которую они назвали “Сетью пар оснований” или “BPNet”. Модель, используемая BPNet для генерации прогнозов, может быть интерпретирована для выявления регуляторных кодов. Это было достигнуто путем прогнозирования того, как белки, называемые транскрипционными факторами, связываются с последовательностями ДНК.

Исследователи провели ряд экспериментов и выполнили комплексное компьютерное моделирование, чтобы определить, как транскрипционные факторы и ДНК связаны вместе, разработав подробную карту до уровня отдельных нуклеотидных оснований. Подробные представления транскрипционных факторов-ДНК позволили исследователям создать инструменты, способные интерпретировать как критические закономерности последовательностей ДНК, так и правила, которые функционируют как регуляторный код.

Джулия Цайтлингер, PhD биолог и компьютерный исследователь в Стэнфордском университете, объяснила, что результаты, полученные из объяснимой нейронной сети, совпали с существующими экспериментальными результатами, но они также содержали удивительные прозрения в регуляторный код генома. Например, модель ИИ позволила команде исследователей открыть правило, которое влияет на то, как работает транскрипционный фактор, называемый Наног. Когда несколько экземпляров мотива Наног присутствуют на одной стороне двойной спирали ДНК, они связываются с ДНК кооперативно. Как объяснила Цайтлингер via ScienceDaily:

“Была длинная цепочка экспериментальных доказательств того, что такая периодичность мотивов иногда существует в регуляторном коде. Однако точные обстоятельства были неясны, и Наног не был подозреваемым. Открытие того, что Наног имеет такой шаблон, и увидение дополнительных деталей его взаимодействий, было удивительным, потому что мы не искали этот шаблон специально.”

Последняя исследовательская работа далеко не первый исследование, которое использует ИИ для анализа ДНК, но, вероятно, это первое исследование, которое открывает “черный ящик” ИИ, чтобы понять, какие последовательности ДНК регулируют гены в геноме. Нейронные сети превосходно находят закономерности в данных, но их прозрения трудно извлечь из моделей, которые они создают. Создав метод анализа того, какие функции модель считает важными для прогнозирования геномных правил, исследователи могли обучить более тонкие модели, которые приводят к новым открытиям.

Архитектура BPNet подобна сетям, используемым для распознавания лиц на изображениях. Когда компьютерные системы распознают лица на изображениях, сеть начинает с обнаружения краев, а затем объединяет эти края вместе. Разница заключается в том, что BPNet учится на последовательностях ДНК, обнаруживая мотивы последовательностей и объединяя эти мотивы в более высокие правила, которые можно использовать для прогнозирования связывания данных на уровне оснований.

После того, как модель достигла высокого порога точности, закономерности, выученные моделью, отслеживаются до исходных входных последовательностей, раскрывая мотивы последовательностей. Наконец, модели предоставляются систематические запросы последовательностей ДНК, что позволяет исследователям понять правила, по которым мотивы последовательностей объединяются и функционируют. Согласно Цайтлингер, модель способна прогнозировать многие более последовательности, чем исследователи могли бы проверить в традиционном, экспериментальном стиле. Кроме того, прогнозирование результатов экспериментальных аномалий позволяет исследователям определить, какие эксперименты были наиболее информативными при проверке модели.

Блогер и программист с специализацией в Machine Learning и Deep Learning темах. Daniel надеется помочь другим использовать силу ИИ для социального блага.