Connect with us

Дослідники штучного інтелекту розробили пояснювальну нейронну мережу для відкриття геномних правил

Штучний інтелект

Дослідники штучного інтелекту розробили пояснювальну нейронну мережу для відкриття геномних правил

mm

Команда дослідників недавно створила пояснювальну нейронну мережу, призначену для допомоги біологам у відкритті загадкових правил, які керують кодом людського геному. Команда дослідників тренувала нейронну мережу на картах взаємодії білка-ДНК, що дозволило штучному інтелекту виявити, як певні послідовності ДНК регулюють певні гени. Дослідники також зробили модель пояснювальною, щоб вони могли проаналізувати висновки моделі та визначити, як послідовності мотивів регулюють гени.

Одним із великих загадок біології є регуляторний код геному. Відомо, що ДНК складається з чотирьох нуклеотидних основ – Аденін, Гуанін, Тимін та Цитозин – але невідомо, як ці пари основ використовуються для регулювання діяльності. Чотири нуклеотидні основи кодують інструкції для побудови білків, але вони також контролюють, де та як гени виражаються (як вони утворюють білки в організмі). Конкретні комбінації та розташування основ створюють секції регуляторного коду, які зв’язуються з сегментами ДНК, і невідомо, які саме ці комбінації.

Інтердисциплінарна команда комп’ютерних вчених та біологів вирішила цю загадку, створивши пояснювальну нейронну мережу. Команда дослідників створила нейронну мережу, яку вони назвали “Мережа пар основ” або “BPNet”. Модель, яку використовує BPNet для генерації прогнозів, може бути інтерпретована для ідентифікації регуляторних кодів. Це було досягнуто шляхом прогнозування того, як білки, звані транскрипційними факторами, зв’язуються з послідовностями ДНК.

Дослідники провели ряд експериментів та здійснили комплексне комп’ютерне моделювання для визначення того, як транскрипційні фактори та ДНК зв’язуються разом, створивши детальну карту до рівня окремих нуклеотидних основ. Детальні представлення транскрипційних факторів-ДНК дозволили дослідникам створити інструменти, здатні інтерпретувати як критичні послідовності ДНК, так і правила, які функціонують як регуляторний код.

Юлія Цайтлінгер, PhD біолог та комп’ютерний дослідник Стенфордського університету, пояснила, що результати, отримані з пояснювальної нейронної мережі, збігалися з існуючими експериментальними результатами, але вони також містили несподівані висновки щодо регуляторного коду геному. Наприклад, модель штучного інтелекту дозволила команді дослідників виявити правило, яке впливає на те, як діє транскрипційний фактор під назвою Nanog. Коли кілька екземплярів мотиву Nanog присутні на одній стороні подвійної спіралі ДНК, вони зв’язуються кооперативно з ДНК. Як пояснила Цайтлінгер через ScienceDaily:

“Було довге слід експериментальних доказів того, що така періодичність мотивів іноді існує в регуляторному коді. Однак точні обставини були неясними, і Nanog не був підозрюваним. Відкриття того, що Nanog має такий шаблон, і побачивши додаткові деталі його взаємодій, було несподіваним, оскільки ми не конкретно шукали цей шаблон.”

Нещодавнє дослідження дослідницької роботи далеко не перше дослідження, яке використовує штучний інтелект для аналізу ДНК, але, ймовірно, це перше дослідження, яке відкрило “чорну скриньку” штучного інтелекту, щоб з’ясувати, які послідовності ДНК регулюють гени в геномі. Нейронні мережі добре знаходять закономірності в даних, але їхні висновки важко витягнути з моделей, які вони створюють. Створивши метод аналізу тих ознак, які модель вважає важливими для прогнозування геномних правил, дослідники могли тренувати більш тонкі моделі, які приводять до нових відкриттів.

Архітектура BPNet подібна до мереж, використовуваних для розпізнавання облич у зображеннях. Коли комп’ютерні системи розпізнавання облич розпізнають обличчя в зображеннях, мережа починає виявляти краї та потім з’єднує ці краї разом. Різниця полягає в тому, що BPNet вчиться на послідовностях ДНК, виявляючи послідовності мотивів та з’єднуючи ці мотиви в вищому порядку правила, які можна використовувати для прогнозування зв’язування даних на рівні основ.

Після того, як модель досягла високого порогу точності, закономірності, вивчені моделлю, відстежуються до оригінальних вхідних послідовностей, відкриваючи послідовності мотивів. Нарешті, моделі надаються систематичні запити послідовностей ДНК, що дозволяє дослідникам зрозуміти правила, за якими послідовності мотивів поєднуються та функціонують. За словами Цайтлінгер, модель здатна прогнозувати багато більше послідовностей, ніж дослідники могли б сподіватися протестувати традиційним, експериментальним способом. Крім того, прогнозування результатів експериментальних аномалій дозволило дослідникам визначити, які експерименти були найбільш інформативними при валідуванні моделі.

Блогер і програміст з спеціалізацією у темах Machine Learning і Deep Learning. Даніель сподівається допомогти іншим використовувати силу штучного інтелекту для соціальної добробути.