Connect with us

Google DeepMind AlphaGenome’u İnsan Genom Fonksiyonunu Çözmek için Tanıttı

Sağlık

Google DeepMind AlphaGenome’u İnsan Genom Fonksiyonunu Çözmek için Tanıttı

mm

Google DeepMind, 28 Ocak’ta AlphaGenome’u yayınladı, bu bir AI modelidir ve DNA dizilerinin biyolojik fonksiyonlara nasıl çevrildiğini öngörür, bir defada bir milyona kadar baz çiftini işler ve 26 varyant etki tahmin benchmarkının 25’inde mevcut modelleri geride bırakır.

Model, Nature dergisinde yayımlanmış ve DeepMind blog sitesinde ayrıntılı olarak açıklanmıştır, hesaplama genetiğinde önemli bir ilerlemeyi temsil etmektedir. Önceki modellerin farklı tahmin görevleri için ayrı sistemler gerektirirken, AlphaGenome tek birleşik bir mimari içinde gen ifadesinden kromatin erişilebilirliğine kadar her şeyi işler.

“AlphaGenome uzun bir DNA parçasını inceleyebilir ve kritik düzenleyici elemanların nerede olduğunu ve gen ifadesi üzerindeki aşağı akış etkilerini öngörebilir” diye DeepMind ekibi açıklamasında yazdı. Modelin milyonluk token bağlam penceresi, genlerin açılıp kapanması üzerinde nasıl etkilediğini anlamak için uzak DNA bölgeleri arasındaki uzun menzilli etkileşimleri yakalamasına olanak tanır.

Nasıl Çalışır

AlphaGenome, ham DNA dizilerini işlemek için Borzoi-stil 1D konvolüsyonel bir ağ ve U-Net mimarisinden oluşan iki sinir ağı mimarisini birleştirir. Bu melez yaklaşım, modelin hem DNA’nın sıralı doğasını hem de düzenleyici elemanlar arasındaki karmaşık uzaysal ilişkileri işlemesine olanak tanır.

Eğitim verisi, yaklaşık 7.000 genomik izi içerir, bunlar ENCODE ve FANTOM konsorsiyumlarından gelmektedir – insan genomu boyunca işlevsel elemanları kataloğleyen büyük işbirliği çabaları. Model, gen ifadesi, DNA erişilebilirliği, protein bağlanması ve kromatin değişiklikleri ölçen deneysel testlerden sinyalleri öngörmeyi öğrenir.

Araştırmacılar için pratik değer, varyant etki tahmini açısından yatmaktadır. Bir hastanın genomunda bir mutasyon olduğunda, klinisyenler bu varyantın önemli olup olmadığını bilmelidir. AlphaGenome, tek bir nükleotid değişikliğinin tüm düzenleyici manzarayı nasıl etkileyebileceğini öngörebilir ve mevcut yöntemlerin kaçırdığı hastalık nedenli varyantları potansiyel olarak saptayabilir.

Model, gen ifadesi ve düzenleyici eleman aktivitesi üzerindeki etkilerini öngörmesi açısından güçlü sonuçlar elde etti. İfade nicel karakter locusları (eQTL’ler) – gen ifadesi seviyelerini etkilediği bilinen varyantlar – AlphaGenome bu görevler için özel olarak eğitilen uzmanlaşmış modellerle eşdeğer veya daha iyi sonuçlar elde etti.

Açık Kaynak Kullanılabilirliği

DeepMind, AlphaGenome’un kaynak kodunu GitHub üzerinde ticari olmayan kullanım için yayınladı, böylece laboratuvarın temel biyoloji araçlarını kamuoyuna açık bir şekilde sunma şeklini sürdürdü. Deposu, model ağırlıkları, çıkarım kodu ve özel diziler üzerinde tahminler çalıştırmak için belgeler içerir.

Açık yayın, 2021’de yayımlanan ve o tarihten bu yana 3 milyondan fazla araştırmacı tarafından kullanılan protein yapısı tahmin aracı AlphaFold tarafından kurulan modeli takip etmektedir. AlphaGenome, tamamlayıcı bir problemi ele alır: AlphaFold proteinlerin nasıl göründüğünü öngörürken, AlphaGenome bu proteinlerin hangi genler tarafından ve ne zaman üretildiğini öngörür.

Google DeepMind CEO’su Demis Hassabis, biyolojiyi laboratuvarın AI yeteneklerinin birincil uygulama alanlarından biri olarak konumlandırdı. Genomik çalışma, DeepMind’in Gemini gibi ürünlerin arkasındaki konuşma AI ve dil modellerinin ötesine geçerek, benzer mimari yenilikleri bilimsel sorunlara uygulamaya yönelik iddialarını genişletiyor.

Neden Bu Önemli

İnsan genomu yaklaşık 3 milyar baz çifti içerir, ancak sadece yaklaşık %1,5’i doğrudan proteinler için kodlar. Geriye kalan %98,5 – uzun süredir “çöp DNA” olarak görülmüştür – genlerin ne zaman, nerede ve nasıl ifade edildiğini kontrol eden düzenleyici elemanları içerir. Bu kodlama olmayan bölgelerdeki mutasyonlar hastalıklara neden olur, ancak hangi varyantların önemli olduğunu belirlemek son derece zor olmuştur.

Geleneksel yöntemler, bireysel varyantları test etmek için pahalı ve zaman alan deneyler gerektirir. AlphaGenome gibi makine öğrenimi modelleri, binlerce varyantı hesaplamalı olarak tarayabilir ve hangilerinin deneysel takip hak ettiğini önceliklendirebilir. Nadir hastalık teşhisinde, hastaların genellikle bilinmeyen etkileri olan yeni varyantlar taşıdığı durumlarda, bu yetenek teşhis yolculuğunu hızlandırabilir.

Modelin milyonluk baz çifti bağlamını işleme yeteneği özellikle önemlidir. Gen düzenleyici elemanları, kontrol ettikleri genlerden yüz binlerce baz çifti uzakta olabilir ve DNA’nın karmaşık 3B folding yoluyla iletişim kurabilir. Önceki modeller daha kısa bağlam pencerelerine sahip olduğu için bu uzun menzilli bağımlılıkları yakalayamadı.

AlphaGenome, biyoloji araştırmalarını dönüştüren AI araçlarının büyüyen ekosistemine katılır. Protein yapısı tahmini, ilaç keşfi ve şimdi gen düzenleme, makine öğrenimi için giderek daha fazla ulaşılabilir hale gelen sorunlardır. Genetik araştırma topluluğu için bu modellerin açık erişilebilirliği, önceden sadece iyi finanse edilen laboratuvarlara özgü olan hesaplama yeteneklerine erişimi demokratikleştirmektedir.

Modelin sınırlamaları da DeepMind’in sunumundan açıkça anlaşılabilir. AlphaGenome deneysel ölçümleri öngörmede mükemmelse, bu öngörülerin klinik sonuçlara çevrilmesi ek doğrulama gerektirir. Kromatin erişilebilirliğini öngörmeden hastalık riskini öngörmeye arasındaki boşluk önemli ölçüde kalır.

Şimdilik AlphaGenome, genomun nasıl çalıştığını anlamayı hızlandırabilecek bir araştırma aracı olarak hizmet eder – klinisyen uygulamaları yıllarca uzakta kalabilir. Modeli zaten 160 ülkeden 3.000 bilim insanının kullanması, araştırma topluluğunun DeepMind’in inşa ettiği şeyin hemen değerini gördüğünü gösteriyor.

Alex McFarland yapay zeka muhabiri ve yazarıdır ve yapay zekadaki son gelişmeleri araştırıyor. Birçok yapay zeka başlangıç şirketi ve dünya çapındaki yayınlarda işbirliği yaptı.