Trí tuệ nhân tạo
Các nhà nghiên cứu AI phát triển mạng nơ-ron giải thích được để khám phá các quy tắc bộ gen

Một nhóm các nhà nghiên cứu gần đây đã tạo ra một mạng nơ-ron giải thích được nhằm giúp các nhà sinh học khám phá các quy tắc bí ẩn điều khiển mã của bộ gen người. Đội nghiên cứu đã đào tạo một mạng nơ-ron trên các bản đồ tương tác protein-DNA, cho phép AI khám phá cách các trình tự DNA nhất định điều chỉnh các gen nhất định. Các nhà nghiên cứu cũng đã làm cho mô hình trở nên giải thích được, để họ có thể phân tích các kết luận của mô hình và xác định cách các trình tự motif điều chỉnh gen.
Một trong những điều bí ẩn lớn trong sinh học là mã điều chỉnh của bộ gen. Người ta biết rằng DNA bao gồm bốn nucleotide base – Adenine, Guanine, Thymine và Cytosine – nhưng không biết cách các cặp base này được sử dụng để điều chỉnh hoạt động. Bốn nucleotide base mã hóa các hướng dẫn để xây dựng protein, nhưng chúng cũng kiểm soát nơi và cách các gen được biểu hiện, (làm thế nào chúng tạo ra protein trong một sinh vật). Các kết hợp và sắp xếp cụ thể của các base tạo ra các phần của mã điều chỉnh ràng buộc với các đoạn DNA, và không biết chính xác những kết hợp này là gì.
Một đội nghiên cứu liên ngành gồm các nhà khoa học máy tính và sinh học đã bắt đầu giải quyết bí ẩn này bằng cách tạo ra một mạng nơ-ron giải thích được. Đội nghiên cứu đã tạo ra một mạng nơ-ron mà họ gọi là “Mạng cặp base” hoặc “BPNet”. Mô hình được sử dụng bởi BPNet để tạo ra dự đoán có thể được giải thích để xác định mã điều chỉnh. Điều này được thực hiện bằng cách dự đoán cách các protein gọi là yếu tố phiên mã ràng buộc với các trình tự DNA.
Các nhà nghiên cứu đã thực hiện nhiều thí nghiệm và mô hình hóa máy tính toàn diện để xác định cách các yếu tố phiên mã và DNA được ràng buộc cùng nhau, tạo ra một bản đồ chi tiết xuống đến mức từng nucleotide base. Các biểu diễn chi tiết yếu tố phiên mã-DNA cho phép các nhà nghiên cứu tạo ra các công cụ có khả năng giải thích cả các mẫu trình tự DNA quan trọng và các quy tắc hoạt động như mã điều chỉnh.
Julia Zeitlinger, tiến sĩ sinh học và nhà nghiên cứu tính toán tại Đại học Stanford, giải thích rằng các kết quả thu được từ mạng nơ-ron giải thích được phù hợp với các kết quả thực nghiệm hiện có, nhưng chúng cũng chứa các thông tin bất ngờ về mã điều chỉnh của bộ gen. Ví dụ, mô hình AI cho phép đội nghiên cứu phát hiện một quy tắc ảnh hưởng đến cách một yếu tố phiên mã gọi là Nanog hoạt động. Khi có nhiều bản sao của motif Nanog trên cùng một mặt của DNA xoắn đôi, chúng ràng buộc hợp tác với DNA. Như Zeitlinger giải thích qua ScienceDaily:
“Đã có một loạt các bằng chứng thực nghiệm rằng sự tuần hoàn của motif như vậy đôi khi tồn tại trong mã điều chỉnh. Tuy nhiên, các hoàn cảnh chính xác vẫn còn khó nắm bắt, và Nanog không phải là một nghi phạm. Phát hiện ra rằng Nanog có một mẫu như vậy, và thấy thêm các chi tiết về các tương tác của nó, là điều bất ngờ vì chúng tôi không tìm kiếm cụ thể mẫu này.”
Bài nghiên cứu gần đây không phải là nghiên cứu đầu tiên sử dụng AI để phân tích DNA, nhưng nó có thể là nghiên cứu đầu tiên mở “hộp đen” của AI để xác định哪 trình tự DNA điều chỉnh gen trong bộ gen. Các mạng nơ-ron giỏi trong việc tìm kiếm các mẫu trong dữ liệu, nhưng các thông tin của chúng khó được trích xuất từ các mô hình mà chúng tạo ra. Bằng cách tạo ra một phương pháp phân tích các tính năng mà mô hình coi là quan trọng để dự đoán các quy tắc bộ gen, các nhà nghiên cứu có thể đào tạo các mô hình tinh vi hơn dẫn đến các khám phá mới.
Kiến trúc của BPNet tương tự như các mạng được sử dụng để nhận dạng khuôn mặt trong hình ảnh. Khi các hệ thống tầm nhìn máy tính nhận dạng khuôn mặt trong hình ảnh, mạng bắt đầu bằng việc phát hiện các cạnh và sau đó kết hợp các cạnh này lại. Sự khác biệt là BPNet học hỏi từ các trình tự DNA, phát hiện các motif trình tự và kết hợp các motif này lại với nhau thành các quy tắc cấp cao hơn có thể được sử dụng để dự đoán sự ràng buộc của dữ liệu ở độ phân giải base.
Sau khi mô hình đạt đến ngưỡng độ chính xác cao, các mẫu được học bởi mô hình được truy vết lại các trình tự đầu vào ban đầu, tiết lộ các motif trình tự. Cuối cùng, mô hình được cung cấp các truy vấn trình tự DNA hệ thống, cho phép các nhà nghiên cứu hiểu các quy tắc mà các motif trình tự kết hợp và hoạt động. Theo Zeitlinger, mô hình có khả năng dự đoán nhiều trình tự hơn những gì các nhà nghiên cứu có thể hy vọng kiểm tra trong một cách thức thực nghiệm truyền thống. Ngoài ra, dự đoán kết quả của các dị thường thực nghiệm cho phép các nhà nghiên cứu xác định哪 các thí nghiệm là thông tin nhất khi xác thực mô hình.










