Connect with us

Google DeepMind представляє AlphaGenome для розшифрування функції людського геному

Охорона здоров’я

Google DeepMind представляє AlphaGenome для розшифрування функції людського геному

mm

Google DeepMind випустив AlphaGenome 28 січня, модель штучного інтелекту, яка передбачає, як послідовності ДНК перекладаються у біологічні функції, обробляючи до одного мільйона пар основ одночасно та перевершуючи існуючі моделі у 25 із 26 бенчмарків прогнозування ефекту варіантів.

Модель, опублікована в Nature та деталізована на блозі DeepMind, представляє суттєвий крок вперед у галузі обчислювальної геноміки. Якщо попередні моделі вимагали окремих систем для різних завдань прогнозування, AlphaGenome обробляє все, від експресії генів до доступності хроматину, у єдиній уніфікованій архітектурі.

“AlphaGenome може переглянути довгу ділянку ДНК та передбачити, де розташовані критичні регуляторні елементи та їхні подальші ефекти на експресію генів”, – написала команда DeepMind у своєму оголошенні. Міліон-токенове вікно контексту моделі дозволяє їй захоплювати довгострокові взаємодії між віддаленими ділянками ДНК, які впливають на те, як гени включаються та виключаються.

Як це працює

AlphaGenome поєднує дві архітектури нейронних мереж: Borzoi-стильну 1D-конвольюційну мережу для обробки сирої послідовності ДНК та архітектуру U-Net, адаптовану з сегментації зображень. Цей гібридний підхід дозволяє моделі обробляти як послідовну природу ДНК, так і складні просторові відносини між регуляторними елементами.

Тренувальні дані охоплюють приблизно 7 000 геномних треків з консорціумів ENCODE та FANTOM – масштівні колективні зусилля, які каталогізували функціональні елементи по всьому людському геному. Модель вчиться передбачати сигнали від експериментальних тестів, що вимірюють експресію генів, доступність ДНК, зв’язування білків та модифікації хроматину.

Для дослідників практична цінність полягає у прогнозуванні ефекту варіантів. Коли геном пацієнта містить мутацію, клініцистам потрібно знати, чи має значення ця варіант. AlphaGenome може передбачити, як одна нуклеотидна зміна впливає на весь регуляторний ландшафт, потенційно виділяючи варіанти, які спричиняють захворювання, яких не виявляють сучасні методи.

Модель досягла сильних результатів у бенчмарках, які перевіряють її здатність передбачати, як генетичні варіанти впливають на експресію генів та активність регуляторних елементів. На експресійних кількісних локусах (eQTLs) – варіантах, відомих тим, що вони впливають на рівні експресії генів, – AlphaGenome дорівнювала або перевершувала спеціалізовані моделі, навчені конкретно для цих завдань.

Відкрита доступність

DeepMind випустив джерельний код AlphaGenome на GitHub для некомерційного використання, продовжуючи лабораторну традицію надання публічно доступних інструментів фундаментальної біології. Репозиторій включає ваги моделі, код інференції та документацію для виконання прогнозів на користомих послідовностях.

Відкритий реліз слідує моделі, встановленій AlphaFold, інструментом DeepMind для прогнозування структури білків, який використовували понад 3 мільйони дослідників з моменту його виходу у 2021 році. AlphaGenome вирішує доповнювальну проблему: тоді як AlphaFold передбачає, яким є білки, AlphaGenome передбачає, коли та де гени виробляють ці білки.

Головний виконавчий директор Google DeepMind Деміс Хассабіс позиціонував біологію як основну область застосування можливостей штучного інтелекту лабораторії. Робота у галузі геноміки розширює амбіції DeepMind за межі розмовного штучного інтелекту та мовних моделей, які живлять продукти, такі як Gemini, застосовуючи подібні архітектурні інновації до наукових проблем.

Чому це важливо

Лудський геном містить приблизно 3 мільярди пар основ, але лише близько 1,5% безпосередньо кодують білки. Решта 98,5% – довгий час вважалися “сміттєвою ДНК” – містять регуляторні елементи, які контролюють, коли, де та як багато генів експресуються. Мутації в цих некодуючих регіонах спричиняють захворювання, але ідентифікація тих варіантів, які мають значення, була надзвичайно складною.

Традиційні методи вимагають дорогих, тривалих експериментів для тестування окремих варіантів. Моделі машинного навчання, такі як AlphaGenome, можуть скрінінгувати тисячі варіантів обчислювально, пріоритизуючи ті, які заслуговують на подальше експериментальне дослідження. Для діагностики рідкісних захворювань, де пацієнти часто несуть нові варіанти з невідомими ефектами, ця здатність могла б прискорити шлях від секвенування до діагностики.

Спроможність моделі обробляти контексти мільйона пар основ особливо значима. Регуляторні елементи генів можуть розташовуватися сотнями тисяч пар основ від генів, які вони контролюють, спілкуючись через складне 3D-звивистість ДНК. Попередні моделі з короткими вікнами контексту не могли захоплювати ці довгострокові залежності.

AlphaGenome приєднується до зростаючої екосистеми інструментів штучного інтелекту, які трансформують біологічні дослідження. Прогнозування структури білків, відкриття ліків та тепер регуляція генів стають все більш доступними проблемами для машинного навчання. Для спільноти генетичних досліджень відкрита доступність цих моделей демократизує доступ до обчислювальних можливостей, які раніше були обмежені добре фінансованими лабораторіями.

Обмеження моделі також очевидні з презентації DeepMind. Хоча AlphaGenome добре справляється з прогнозуванням експериментальних вимірювань, переклад цих прогнозів у клінічні результати вимагає додаткової валідации. Пропуск між прогнозуванням доступності хроматину та прогнозуванням ризику захворювання залишається суттєвим.

Наразі AlphaGenome служить інструментом дослідження – інструментом, який міг би прискорити розуміння того, як працює геном, навіть якщо клінічні застосування залишаються на роки вперед. 3 000 вчених з 160 країн, які вже використовують модель, свідчать про те, що дослідницька спільнота бачить негайну цінність у тому, що створила DeepMind.

Алекс Макфарленд - журналіст та письменник з питань штучного інтелекту, який досліджує останні розробки в галузі штучного інтелекту. Він співпрацював з численними стартапами та виданнями з штучного інтелекту у світі.