ปัญญาประดิษฐ์

จาก Evo 1 ถึง Evo 2: วิธีการที่ NVIDIA กำลังปฏิวัติวิจัยจีโนมิกส์และนวัตกรรมทางชีววิทยาที่ขับเคลื่อนด้วย AI

mm

ลองนึกภาพโลกที่เราสามารถคาดการณ์พฤติกรรมของชีวิตได้โดยการวิเคราะห์ลำดับของตัวอักษร นี่ไม่ใช่นิยายวิทยาศาสตร์หรือโลกเวทมนตร์ แต่เป็นโลกจริงที่นักวิทยาศาสตร์พยายามบรรลุเป้าหมายนี้มาหลายปีแล้ว ลำดับนี้ประกอบด้วยนิวคลีโอไทด์สี่ชนิด (A, T, C และ G) ซึ่งเป็นคำสั่งพื้นฐานสำหรับชีวิตบนโลก จากจุลินทรีย์ที่เล็กที่สุดจนถึงสัตว์เลี้ยงลูกด้วยนมที่ใหญ่ที่สุด การถอดรหัสลำดับนี้มีศักยภาพในการปลดล็อกกระบวนการทางชีววิทยาที่ซับซ้อน โดยเปลี่ยนแปลงสาขาต่างๆ เช่น การแพทย์เฉพาะบุคคลและความยั่งยืนของสิ่งแวดล้อม

อย่างไรก็ตาม แม้ว่าจะมีศักยภาพที่ยิ่งใหญ่นี้ การถอดรหัสจีโนมจุลินทรีย์แม้แต่จีโนมที่ง่ายที่สุดก็เป็นงานที่ซับซ้อนมาก จีโนมเหล่านี้ประกอบด้วยคู่เบส DNA หลายล้านคู่ที่ควบคุมการโต้ตอบระหว่าง DNA, RNA และโปรตีน – สามองค์ประกอบหลักในหลักการของชีววิทยาอะโรมาเตอร์ ความซับซ้อนนี้มีอยู่ในหลายระดับ ตั้งแต่อะตอมเดี่ยวจนถึงจีโนมทั้งหมด ซึ่งสร้างข้อมูลทางพันธุกรรมที่กว้างขวางซึ่งพัฒนาในช่วงหลายพันล้านปี

เครื่องมือคำนวณแบบดั้งเดิมต้องดิ้นรนเพื่อจัดการกับความซับซ้อนของลำดับทางชีววิทยา แต่ด้วยการเกิดขึ้นของ AI ที่สร้างขึ้นใหม่ ตอนนี้เป็นไปได้ที่จะขยายไปถึงลำดับหลายล้านลำดับและเข้าใจความสัมพันธ์ที่ซับซ้อนระหว่างลำดับต่างๆ โดยอาศัยความก้าวหน้านี้ นักวิจัยที่สถาบัน Arc, มหาวิทยาลัย Stanford และ NVIDIA ได้ทำงานเกี่ยวกับการสร้างระบบ AI ที่สามารถเข้าใจลำดับทางชีววิทยาได้เหมือนกับโมเดลภาษาที่เข้าใจข้อความของมนุษย์ ตอนนี้พวกเขาได้ทำการค้นพบที่สำคัญโดยการสร้างโมเดลที่จับได้ทั้งธรรมชาติแบบหลายรูปแบบของหลักการและความซับซ้อนของวิวัฒนาการ นวัตกรรมนี้อาจนำไปสู่การคาดการณ์และการออกแบบลำดับทางชีววิทยาที่ใหม่ ตั้งแต่อะตอมเดี่ยวจนถึงจีโนมทั้งหมด ในบทความนี้ เราจะสำรวจว่าเทคโนโลยีนี้ทำงานอย่างไร การใช้งานที่เป็นไปได้ ความท้าทายที่ต้องเผชิญ และอนาคตของการสร้างแบบจำลองจีโนมิกส์

EVO 1: โมเดลที่เป็นปioneer ในการสร้างแบบจำลองจีโนมิกส์

การวิจัยนี้ได้รับความสนใจในปลายปี 2024 เมื่อ NVIDIA และผู้ร่วมงานของพวกเขาแนะนำ Evo 1 โมเดลที่เป็นปioneer สำหรับการวิเคราะห์และสร้างลำดับทางชีววิทยา ตั้งแต่ DNA, RNA และโปรตีน โมเดลนี้ได้รับการฝึกฝนจากจีโนมโพรคาริโอติกและจีโนมฟาจ 2.7 ล้านลำดับ รวมทั้งหมด 300 พันล้านตัวอักษร โมเดลนี้มุ่งเน้นไปที่การรวมหลักการของชีววิทยาอะโรมาเตอร์ โดยการสร้างแบบจำลองการไหลของข้อมูลทางพันธุกรรมจาก DNA ไปยัง RNA และโปรตีน สถาปัตยกรรม StripedHyena ซึ่งเป็นโมเดลแบบผสมที่ใช้ฟิลเตอร์แบบคอนโวลูชันและเกต สามารถจัดการบริบทที่ยาวได้ถึง 131,072 ตัวอักษร โดยการออกแบบนี้ Evo 1 สามารถเชื่อมโยงการเปลี่ยนแปลงลำดับขนาดเล็กกับผลกระทบในระบบและระดับอินทรีย์ โดยเชื่อมช่องว่างระหว่างชีววิทยาอะโรมาเตอร์และจีโนมิกส์วิวัฒนาการ

Evo 1 เป็นขั้นตอนแรกในการสร้างแบบจำลองการวิวัฒนาการทางชีววิทยา โดยการคาดการณ์การโต้ตอบระหว่างโมเลกุลและความแปรผันทางพันธุกรรมโดยการวิเคราะห์รูปแบบการวิวัฒนาการในลำดับทางพันธุกรรม อย่างไรก็ตาม เมื่อนักวิทยาศาสตร์พยายามใช้มันในจีโนมยูคาริโอตที่ซับซ้อนมากขึ้น ข้อจำกัดของโมเดลก็ชัดเจนขึ้น Evo 1 ต้องดิ้นรนในการแก้ไขความแตกต่างของนิวคลีโอไทด์เดี่ยวในลำดับ DNA ที่ยาวและต้องใช้ทรัพยากรการคำนวณมากสำหรับจีโนมที่ใหญ่ขึ้น ความท้าทายเหล่านี้นำไปสู่ความจำเป็นในการสร้างโมเดลที่สามารถรวมข้อมูลทางชีววิทยาได้หลายระดับ

EVO 2: โมเดลที่เป็นพื้นฐานสำหรับการสร้างแบบจำลองจีโนมิกส์

โดยการสร้างบนความก้าวหน้าจาก Evo-1 นักวิจัยได้เปิดตัว Evo 2 ในเดือนกุมภาพันธ์ 2025 โดยก้าวหน้าในสาขาการสร้างแบบจำลองลำดับทางชีววิทยา ฝึกฝน จากคู่เบส DNA 9.3 ล้านล้านลำดับ โมเดลนี้ได้เรียนรู้ที่จะเข้าใจและคาดการณ์ผลกระทบของการเปลี่ยนแปลงทางพันธุกรรมต่อฟังก์ชันของลำดับทางชีววิทยา โดยครอบคลุมทุกโดเมนของชีวิต ตั้งแต่แบคทีเรีย อาร์เคีย พืช ฟังไจ และสัตว์ ด้วยพารามิเตอร์มากกว่า 40 พันล้าน โมเดล Evo-2 สามารถจัดการลำดับได้ยาวถึง 1 ล้านคู่เบส ซึ่งเป็นสิ่งที่โมเดลก่อนหน้านี้ไม่สามารถทำได้

สิ่งที่ทำให้ Evo 2 แตกต่างจากโมเดลก่อนหน้าคือความสามารถในการสร้างแบบจำลองไม่เพียงแต่ลำดับ DNA แต่ยังรวมถึงการโต้ตอบระหว่าง DNA, RNA และโปรตีน – หลักการของชีววิทยาอะโรมาเตอร์ทั้งหมด ซึ่งช่วยให้ Evo 2 คาดการณ์ผลกระทบของการเปลี่ยนแปลงทางพันธุกรรมได้อย่างแม่นยำ ตั้งแต่การเปลี่ยนแปลงนิวคลีโอไทด์เดี่ยวจนถึงการเปลี่ยนแปลงโครงสร้างที่ใหญ่ขึ้น

คุณลักษณะสำคัญของ Evo 2 คือความสามารถในการคาดการณ์แบบ zero-shot ซึ่งช่วยให้สามารถคาดการณ์ผลกระทบของการเปลี่ยนแปลงทางพันธุกรรมได้โดยไม่ต้องมีการปรับแต่งเฉพาะงาน ตัวอย่างเช่น มันสามารถจำแนกการเปลี่ยนแปลงของยีน BRCA1 ที่สำคัญทางคลินิก ซึ่งเป็นปัจจัยสำคัญในการวิจัยมะเร็งเต้านม โดยการวิเคราะห์ลำดับ DNA เพียงอย่างเดียว

การประยุกต์ใช้ที่เป็นไปได้ในวิทยาศาสตร์ชีวโมเลกุล

ความสามารถของ Evo 2 เปิดโอกาสใหม่ๆ ในสาขาจีโนมิกส์ ชีววิทยาอะโรมาเตอร์ และไบโอเทคนอลลาจี การประยุกต์ใช้ที่มีแนวโน้มมากที่สุด ได้แก่:

  • การดูแลสุขภาพและการค้นพบยา: Evo 2 สามารถคาดการณ์ได้ว่าแปรผันของยีนใดที่เกี่ยวข้องกับโรคเฉพาะ และช่วยในการพัฒนายาที่มุ่งเป้าไปที่โรคเหล่านั้น ตัวอย่างเช่น ในการทดสอบกับการเปลี่ยนแปลงของยีน BRCA1 ที่เกี่ยวข้องกับมะเร็งเต้านม Evo 2 บรรลุความแม่นยำมากกว่า 90% ในการคาดการณ์ว่าการเปลี่ยนแปลงใดที่เป็นอันตรายหรือไม่ การค้นพบเหล่านี้สามารถเร่งการพัฒนายาใหม่ๆ และการรักษาแบบเฉพาะบุคคล
  • ชีววิทยาสังเคราะห์และวิศวกรรมพันธุกรรม: Evo 2 สามารถสร้างจีโนมทั้งหมดได้ ซึ่งเปิดโอกาสใหม่ในการออกแบบสิ่งมีชีวิตสังเคราะห์ที่มีลักษณะเฉพาะต้องการ นักวิจัยสามารถใช้ Evo 2 เพื่อสร้างยีนที่มีฟังก์ชันเฉพาะเพื่อเพิ่มพูนการพัฒนาของไบโอเชื้อเพลิง สารเคมีที่เป็นมิตรกับสิ่งแวดล้อม และยาที่ใหม่
  • ชีววิทยาพืช: สามารถใช้ในการออกแบบพืชที่มีลักษณะเฉพาะ เช่น ทนทานต่อความแห้งแล้งหรือต้านทานแมลง เพื่อช่วยให้แน่ใจถึงความมั่นคงด้านอาหารและความยั่งยืนด้านเกษตรกรรม
  • วิทยาศาสตร์สิ่งแวดล้อม: Evo 2 สามารถใช้ในการออกแบบไบโอเชื้อเพลิงหรือวิศวกรรมโปรตีนที่สามารถย่อยสลายมลพิษสิ่งแวดล้อม เช่น น้ำมันหรือพลาสติก เพื่อช่วยเหลือในการรักษาสิ่งแวดล้อม

ความท้าทายและทิศทางในอนาคต

尽管 Evo 2 มีความสามารถที่น่าประทับใจ แต่ก็เผชิญกับความท้าทาย ความท้าทายหลักคือความซับซ้อนในการคำนวณที่เกี่ยวข้องกับการฝึกฝนและการใช้งานโมเดล โดยมีหน้าต่างบริบท 1 ล้านคู่เบสและพารามิเตอร์ 40 พันล้าน Evo 2 ต้องการทรัพยากรการคำนวณที่สำคัญเพื่อทำงานได้อย่างมีประสิทธิภาพ ซึ่งทำให้ยากสำหรับทีมวิจัยขนาดเล็กในการใช้ประโยชน์จากศักยภาพของมันอย่างเต็มที่

นอกจากนี้ แม้ว่า Evo 2 จะมีความสามารถในการคาดการณ์ผลกระทบของการเปลี่ยนแปลงทางพันธุกรรม แต่ยังมีหลายสิ่งที่ต้องเรียนรู้เกี่ยวกับวิธีการใช้มันในการออกแบบระบบชีววิทยาที่ใหม่จากศูนย์ การสร้างลำดับทางชีววิทยาที่สมจริงเป็นเพียงขั้นตอนแรก ความท้าทายที่แท้จริงอยู่ที่การเข้าใจวิธีการใช้พลังงานนี้เพื่อสร้างระบบชีววิทยาที่ใช้งานได้และยั่งยืน

การเข้าถึงและประชาธิปไตยของ AI ในจีโนมิกส์

หนึ่งในแง่มุมที่น่าตื่นเต้นที่สุดของ Evo 2 คือการเปิดเผยต่อสาธารณะ แบบเปิด เพื่อทำให้เครื่องมือการสร้างแบบจำลองจีโนมิกส์ที่ล้ำสมัยเข้าถึงได้ NVIDIA ได้เผยแพร่พารามิเตอร์ โค้ดฝึกอบรม และชุดข้อมูลสาธารณะ ทำให้นักวิจัยทั่วโลกสามารถสำรวจและขยายความสามารถของ Evo 2 ได้ ซึ่งเร่งการนวัตกรรมทั่วชุมชนวิทยาศาสตร์

สรุป

Evo 2 คือความก้าวหน้าที่สำคัญในการสร้างแบบจำลองจีโนมิกส์ โดยใช้ AI เพื่อถอดรหัสภาษาทางพันธุกรรมที่ซับซ้อนของชีวิต ความสามารถในการสร้างแบบจำลองลำดับ DNA และการโต้ตอบระหว่าง DNA, RNA และโปรตีน เปิดโอกาสใหม่ในการแพทย์, การค้นพบยา, ชีววิทยาสังเคราะห์ และวิทยาศาสตร์สิ่งแวดล้อม Evo 2 สามารถคาดการณ์การเปลี่ยนแปลงทางพันธุกรรมและออกแบบลำดับทางชีววิทยาที่ใหม่ โดยมีศักยภาพในการเปลี่ยนแปลงอนาคตของวิทยาศาสตร์ชีววิทยาและสิ่งแวดล้อม อย่างไรก็ตาม ความซับซ้อนในการคำนวณของมันทำให้ทีมวิจัยขนาดเล็กต้องเผชิญกับความท้าทาย โดยการเผยแพร่แบบเปิด NVIDIA ทำให้นักวิจัยทั่วโลกสามารถสำรวจและขยายความสามารถของ Evo 2 ได้ ซึ่งจะขับเคลื่อนนวัตกรรมในจีโนมิกส์และไบโอเทคนอลลาจี และเมื่อเทคโนโลยีดำเนินต่อไป มันจะเปลี่ยนแปลงอนาคตของวิทยาศาสตร์ชีววิทยาและสิ่งแวดล้อม

ดร. Tehseen Zia เป็น Professor ที่ COMSATS University Islamabad โดยได้รับ PhD ใน AI จาก Vienna University of Technology, Austria มีเชี่ยวชาญด้าน Artificial Intelligence, Machine Learning, Data Science, และ Computer Vision โดยมีส่วนร่วมที่สำคัญด้วยการเผยแพร่ในวารสารวิทยาศาสตร์ที่มีชื่อเสียง ดร. Tehseen ยังได้ดำเนินโครงการอุตสาหกรรมต่างๆ ในฐานะ Principal Investigator และให้บริการเป็นที่ปรึกษาด้าน AI