Kecerdasan buatan
Dari Evo 1 ke Evo 2: Bagaimana NVIDIA Mengubah Penelitian Genomik dan Inovasi Biologi yang Didorong AI
Bayangkan sebuah dunia di mana kita bisa memprediksi perilaku kehidupan hanya dengan menganalisis urutan huruf. Ini bukanlah fiksi ilmiah atau dunia ajaib, tetapi dunia nyata di mana para ilmuwan telah berusaha mencapai tujuan ini selama bertahun-tahun. Urutan-urutan ini, yang terdiri dari empat nukleotida (A, T, C, dan G), mengandung instruksi dasar untuk kehidupan di Bumi, dari mikroba terkecil hingga mamalia terbesar. Menguraikan urutan-urutan ini memiliki potensi untuk membuka proses biologis yang kompleks, mengubah bidang seperti pengobatan personal dan keberlanjutan lingkungan.
Namun, meskipun memiliki potensi yang luar biasa, menguraikan bahkan genom mikroba sederhana adalah tugas yang sangat kompleks. Genom ini terdiri dari jutaan pasang basa DNA yang mengatur interaksi antara DNA, RNA, dan protein – tiga elemen kunci dalam dogma sentral biologi molekuler. Kompleksitas ini ada pada beberapa tingkat, dari molekul individu hingga genom seluruh, menciptakan bidang informasi genetik yang luas yang berkembang selama miliaran tahun.
Alat komputasi tradisional telah berjuang untuk menangani kompleksitas urutan biologis. Namun, dengan munculnya AI generatif, sekarang memungkinkan untuk menskalakan triliunan urutan dan memahami hubungan kompleks di seluruh urutan token. Membangun pada kemajuan ini, para peneliti di Arc Institute, Stanford University, dan NVIDIA telah bekerja pada pembangunan sistem AI yang dapat memahami urutan biologis seperti model bahasa besar memahami teks manusia. Sekarang, mereka telah membuat kemajuan yang luar biasa dengan menciptakan model yang menangkap sifat multimodal dogma sentral dan kompleksitas evolusi. Inovasi ini dapat memungkinkan untuk memprediksi dan merancang urutan biologis baru, dari molekul individu hingga genom seluruh. Dalam artikel ini, kita akan menjelajahi bagaimana teknologi ini bekerja, aplikasi potensialnya, tantangannya, dan masa depan model genomik.
EVO 1: Sebuah Model Pionir dalam Pemodelan Genomik
Penelitian ini mendapat perhatian pada akhir 2024 ketika NVIDIA dan kolaboratornya memperkenalkan Evo 1, sebuah model yang luar biasa untuk menganalisis dan menghasilkan urutan biologis di seluruh DNA, RNA, dan protein. Dilatih pada 2,7 juta genom prokariotik dan bakteriofag, dengan total 300 miliar token nukleotida, model ini berfokus pada integrasi dogma sentral biologi molekuler, memodelkan aliran informasi genetik dari DNA ke RNA ke protein. Arsitektur StripedHyena, sebuah model hibrida yang menggunakan filter konvolusional dan gerbang, secara efisien menangani konteks panjang hingga 131.072 token. Desain ini memungkinkan Evo 1 untuk menghubungkan perubahan urutan kecil dengan efek sistemik dan organisme yang lebih luas, menjembatani kesenjangan antara biologi molekuler dan genetik evolusioner.
Evo 1 adalah langkah pertama dalam pemodelan komputasi evolusi biologis. Ini berhasil memprediksi interaksi molekuler dan variasi genetik dengan menganalisis pola evolusi dalam urutan genetik. Namun, ketika para ilmuwan berusaha menerapkan model ini pada genom eukariotik yang lebih kompleks, keterbatasan model ini menjadi jelas. Evo 1 berjuang dengan resolusi nukleotida tunggal di atas urutan DNA panjang dan secara komputasi mahal untuk genom yang lebih besar. Tantangan ini memimpin kebutuhan akan model yang lebih maju yang dapat mengintegrasikan data biologis di seluruh skala.
EVO 2: Sebuah Model Fondasi untuk Pemodelan Genomik
Membangun pada pelajaran yang dipelajari dari Evo-1, para peneliti meluncurkan Evo 2 pada Februari 2025, maju dalam bidang pemodelan urutan biologis. Dilatih pada 9,3 triliun pasang basa DNA, model ini telah belajar untuk memahami dan memprediksi konsekuensi fungsional dari variasi genetik di seluruh domain kehidupan, termasuk bakteri, arkea, tumbuhan, fungi, dan hewan. Dengan lebih dari 40 miliar parameter, model Evo-2 dapat menangani panjang urutan yang belum pernah terjadi sebelumnya, hingga 1 juta pasang basa, sesuatu yang tidak dapat dilakukan oleh model sebelumnya, termasuk Evo-1.
Apa yang membedakan Evo 2 dari pendahulunya adalah kemampuannya untuk memodelkan tidak hanya urutan DNA tetapi juga interaksi antara DNA, RNA, dan protein – seluruh dogma sentral biologi molekuler. Ini memungkinkan Evo 2 untuk secara akurat memprediksi dampak mutasi genetik, dari perubahan nukleotida kecil hingga variasi struktural yang lebih besar, dengan cara yang sebelumnya tidak mungkin.
Fitur kunci dari Evo 2 adalah kemampuan prediksi zero-shot yang kuat, yang memungkinkan untuk memprediksi efek fungsional dari mutasi tanpa memerlukan penyetelan tugas khusus. Misalnya, ini secara akurat mengklasifikasikan varian BRCA1 yang signifikan secara klinis, faktor kunci dalam penelitian kanker payudara, dengan menganalisis urutan DNA saja.
Potensi Aplikasi dalam Ilmu Biomolekuler
Kemampuan Evo 2 membuka peluang baru dalam genetik, biologi molekuler, dan bioteknologi. Beberapa aplikasi paling menjanjikan termasuk:
- Pelayanan Kesehatan dan Penemuan Obat: Evo 2 dapat memprediksi varian gen yang terkait dengan penyakit tertentu, membantu dalam pengembangan terapi yang ditargetkan. Misalnya, dalam tes dengan varian gen BRCA1 yang terkait dengan kanker payudara, Evo 2 mencapai akurasi lebih dari 90% dalam memprediksi mana mutasi yang jinak versus potensial patogenik. Wawasan seperti ini dapat mempercepat pengembangan obat baru dan terapi personal.
- Biologi Sintetik dan Rekayasa Genetik: Kemampuan Evo 2 untuk menghasilkan genom seluruh membuka peluang baru dalam merancang organisme sintetik dengan sifat yang diinginkan. Para peneliti dapat menggunakan Evo 2 untuk merancang gen dengan fungsi spesifik, memajukan pengembangan bahan bakar bio, bahan kimia ramah lingkungan, dan terapi baru.
- Bioteknologi Pertanian: Ini dapat digunakan untuk merancang tanaman yang dimodifikasi secara genetik dengan sifat yang ditingkatkan seperti ketahanan kekeringan atau resistensi hama, menyumbang pada keamanan pangan global dan keberlanjutan pertanian.
- Ilmu Lingkungan: Evo 2 dapat diterapkan untuk merancang bahan bakar bio atau merancang protein yang dapat memecah polusi lingkungan seperti minyak atau plastik, menyumbang pada upaya keberlanjutan.
Tantangan dan Arah Masa Depan
Meskipun kemampuan yang luar biasa, Evo 2 menghadapi tantangan. Salah satu hambatan utama adalah kompleksitas komputasi yang terlibat dalam pelatihan dan menjalankan model. Dengan jendela konteks 1 juta pasang basa dan 40 miliar parameter, Evo 2 memerlukan sumber daya komputasi yang signifikan untuk berfungsi secara efektif. Ini membuatnya sulit bagi tim penelitian yang lebih kecil untuk sepenuhnya memanfaatkan potensinya tanpa akses ke infrastruktur komputasi kinerja tinggi.
Selain itu, meskipun Evo 2 unggul dalam memprediksi efek mutasi genetik, masih banyak yang harus dipelajari tentang bagaimana menggunakan model ini untuk merancang sistem biologis baru dari awal. Menghasilkan urutan biologis yang realistis hanya langkah pertama; tantangan sebenarnya terletak pada memahami bagaimana menggunakan kekuatan ini untuk menciptakan sistem biologis yang fungsional dan berkelanjutan.
Aksesibilitas dan Demokratisasi AI dalam Genomik
Salah satu aspek paling menarik dari Evo 2 adalah ketersediaannya yang terbuka. Untuk mendemokratisasi akses ke alat pemodelan genomik yang maju, NVIDIA telah membuat parameter model, kode pelatihan, dan dataset tersedia secara publik. Pendekatan akses terbuka ini memungkinkan peneliti dari seluruh dunia untuk menjelajahi dan memperluas kemampuan Evo 2, mempercepat inovasi di seluruh komunitas ilmiah.
Ringkasan
Evo 2 adalah kemajuan signifikan dalam pemodelan genomik, menggunakan AI untuk mendekode bahasa genetik kehidupan. Kemampuan untuk memodelkan urutan DNA dan interaksinya dengan RNA dan protein membuka peluang baru dalam pelayanan kesehatan, penemuan obat, biologi sintetik, dan ilmu lingkungan. Evo 2 dapat memprediksi mutasi genetik dan merancang urutan biologis baru, menawarkan potensi transformasional untuk pengobatan personal dan solusi berkelanjutan. Namun, kompleksitas komputasinya menyajikan tantangan, terutama bagi tim penelitian yang lebih kecil. Dengan membuat Evo 2 terbuka, NVIDIA memungkinkan peneliti di seluruh dunia untuk menjelajahi dan memperluas kemampuan model ini, memacu inovasi dalam genetik dan bioteknologi. Ketika teknologi terus berkembang, ini memiliki potensi untuk membentuk kembali masa depan ilmu biologi dan keberlanjutan lingkungan.












