Kesehatan

Google DeepMind Meluncurkan AlphaGenome untuk Menguraikan Fungsi Genom Manusia

mm

Google DeepMind merilis AlphaGenome pada 28 Januari, sebuah model AI yang memprediksi bagaimana urutan DNA diterjemahkan menjadi fungsi biologis, memproses hingga satu juta pasangan basa sekaligus dan mengungguli model yang ada dalam 25 dari 26 benchmark prediksi efek varian.

Model ini, diterbitkan di Nature dan dijelaskan di blog DeepMind, merupakan kemajuan signifikan dalam genomika komputasi. Di mana model sebelumnya memerlukan sistem terpisah untuk tugas prediksi yang berbeda, AlphaGenome menangani semua hal dari ekspresi gen ke aksesibilitas kromatin dalam arsitektur tunggal.

“AlphaGenome dapat melihat sepanjang urutan DNA dan memprediksi di mana elemen pengaturan kritis dan efek downstreamnya pada ekspresi gen,” tim DeepMind menulis dalam pengumuman mereka. Jendela konteks million-token model ini memungkinkan untuk menangkap interaksi jarak jauh antara wilayah DNA yang jauh yang mempengaruhi bagaimana gen diaktifkan dan dimatikan.

Bagaimana Ini Bekerja

AlphaGenome menggabungkan dua arsitektur jaringan saraf: jaringan konvolusi 1D gaya Borzoi untuk memproses urutan DNA mentah dan arsitektur U-Net yang disesuaikan dari segmentasi gambar. Pendekatan hibrida ini memungkinkan model untuk menangani baik sifat urutan DNA dan hubungan spasial yang kompleks antara elemen pengaturan.

Data pelatihan mencakup sekitar 7.000 trek genomik dari konsorsium ENCODE dan FANTOM—upaya kolaboratif besar yang telah mengatalogkan elemen fungsional di seluruh genom manusia. Model ini belajar untuk memprediksi sinyal dari pengukuran eksperimental yang mengukur ekspresi gen, aksesibilitas DNA, pengikatan protein, dan modifikasi kromatin.

Bagi peneliti, nilai praktisnya terletak pada prediksi efek varian. Ketika genom pasien mengandung mutasi, klinisi perlu mengetahui apakah varian tersebut penting. AlphaGenome dapat memprediksi bagaimana perubahan nukleotida tunggal mempengaruhi lanskap pengaturan secara keseluruhan, sehingga memungkinkan untuk mengidentifikasi varian yang menyebabkan penyakit yang mungkin tidak terdeteksi oleh metode saat ini.

Model ini mencapai hasil yang kuat pada benchmark yang menguji kemampuan untuk memprediksi bagaimana varian genetik mempengaruhi ekspresi gen dan aktivitas elemen pengaturan. Pada lokus eQTL (ekspresi kuantitatif trait loci)—varian yang diketahui mempengaruhi tingkat ekspresi gen—AlphaGenome mencapai atau melebihi model khusus yang dilatih untuk tugas-tugas tersebut.

Ketersediaan Open Source

DeepMind merilis kode sumber AlphaGenome di GitHub untuk penggunaan non-komersial, melanjutkan pola lab untuk membuat alat biologi dasar tersedia secara publik. Repositori ini mencakup bobot model, kode inferensi, dan dokumentasi untuk menjalankan prediksi pada urutan kustom.

Pelesenan terbuka ini mengikuti model yang ditetapkan oleh AlphaFold, alat prediksi struktur protein DeepMind yang telah digunakan oleh lebih dari 3 juta peneliti sejak peluncurannya pada 2021. AlphaGenome menangani masalah komplementer: sementara AlphaFold memprediksi bagaimana protein terlihat, AlphaGenome memprediksi kapan dan di mana gen menghasilkan protein tersebut.

CEO Google DeepMind Demis Hassabis telah menempatkan biologi sebagai domain aplikasi utama untuk kemampuan AI lab. Pekerjaan genomika ini memperluas ambisi DeepMind di luar AI percakapan dan model bahasa yang menggerakkan produk seperti Gemini, menerapkan inovasi arsitektur yang sama pada masalah ilmiah.

Mengapa Ini Penting

Genom manusia mengandung sekitar 3 miliar pasangan basa, tetapi hanya sekitar 1,5% yang secara langsung mengkodekan protein. Sisanya, sekitar 98,5%—yang pernah dianggap sebagai “DNA sampah”—mengandung elemen pengaturan yang mengontrol kapan, di mana, dan seberapa banyak gen diekspresikan. Mutasi pada wilayah non-koding ini dapat menyebabkan penyakit, tetapi mengidentifikasi varian mana yang penting sangat sulit.

Metode tradisional memerlukan eksperimen yang mahal dan memakan waktu untuk menguji varian individual. Model AI seperti AlphaGenome dapat menyaring ribuan varian secara komputasi, memprioritaskan varian mana yang layak untuk diikuti dengan eksperimen. Untuk diagnosis penyakit langka, di mana pasien sering membawa varian baru dengan efek yang tidak diketahui, kemampuan ini dapat mempercepat jalur dari pengurutan ke diagnosis.

Kemampuan model untuk memproses konteks million basa-pasangan sangat signifikan. Elemen pengaturan gen dapat berada ratusan ribu basa-pasangan jauh dari gen yang dikendalikan, berkomunikasi melalui lipatan 3D DNA yang kompleks. Model sebelumnya dengan jendela konteks yang lebih pendek tidak dapat menangkap ketergantungan jarak jauh ini.

AlphaGenome bergabung dengan ekosistem AI yang berkembang yang mengubah penelitian biologi. Prediksi struktur protein, penemuan obat, dan sekarang regulasi gen adalah masalah yang semakin dapat diatasi dengan machine learning. Bagi komunitas penelitian genetika, ketersediaan terbuka dari model ini mendemokratisasi akses ke kemampuan komputasi yang sebelumnya terbatas pada lab yang dibiayai dengan baik.

Batasan model ini juga jelas dari presentasi DeepMind. Sementara AlphaGenome unggul dalam memprediksi pengukuran eksperimental, menerjemahkan prediksi tersebut ke hasil klinis memerlukan validasi tambahan. Jarak antara memprediksi aksesibilitas kromatin dan memprediksi risiko penyakit masih sangat besar.

Untuk saat ini, AlphaGenome berfungsi sebagai alat penelitian—yang dapat mempercepat pemahaman tentang bagaimana genom bekerja, bahkan jika aplikasi klinis masih beberapa tahun lagi. 3.000 ilmuwan di 160 negara yang sudah menggunakan model ini menunjukkan bahwa komunitas penelitian melihat nilai langsung dalam apa yang telah dibangun oleh DeepMind.

Alex McFarland adalah seorang jurnalis dan penulis AI yang menjelajahi perkembangan terbaru dalam kecerdasan buatan. Ia telah berkolaborasi dengan berbagai startup dan publikasi AI di seluruh dunia.