Trí tuệ nhân tạo

Trí tuệ nhân tạo vừa mô phỏng 500 triệu năm tiến hóa – Và tạo ra một loại protein mới!

Published February 4, 2025

Updated April 26, 2026

Dr. Tehseen Zia

Tiến hóa đã tinh chỉnh sự sống ở mức phân tử trong hàng tỷ năm. Các protein, những khối xây dựng cơ bản của sự sống, đã tiến hóa thông qua quá trình này để thực hiện các chức năng sinh học khác nhau, từ chống lại nhiễm trùng đến tiêu hóa thức ăn. Những phân tử phức tạp này bao gồm các chuỗi axit amin dài được sắp xếp theo các trình tự chính xác quyết định cấu trúc và chức năng của chúng. Mặc dù tự nhiên đã tạo ra sự đa dạng phi thường của protein, nhưng việc hiểu cấu trúc và thiết kế hoàn toàn mới của protein đã trở thành một thách thức phức tạp đối với các nhà khoa học.

Những tiến bộ gần đây trong trí tuệ nhân tạo đang biến đổi khả năng của chúng ta trong việc giải quyết một số thách thức quan trọng nhất của sinh học. Trước đây, trí tuệ nhân tạo được sử dụng để dự đoán cách một trình tự protein nhất định sẽ gấp và hành xử – một thách thức phức tạp do số lượng cấu hình khổng lồ. Gần đây, trí tuệ nhân tạo đã tiến bộ để tạo ra hoàn toàn mới các protein với quy mô chưa từng có. Cột mốc này đã được đạt được với ESM3, một mô hình ngôn ngữ tạo sinh đa phương thức được thiết kế bởi EvolutionaryScale. Không giống như các hệ thống trí tuệ nhân tạo thông thường được thiết kế cho xử lý văn bản, ESM3 đã được đào tạo để hiểu trình tự protein, cấu trúc và chức năng. Điều làm cho nó thực sự đáng chú ý là khả năng mô phỏng 500 triệu năm tiến hóa — một kỳ công đã dẫn đến việc tạo ra một protein phát sáng hoàn toàn mới, điều mà chưa từng được thấy trong tự nhiên.

Đột phá này là một bước tiến quan trọng hướng tới việc làm cho sinh học trở nên lập trình được nhiều hơn, mở ra những khả năng mới cho việc thiết kế protein tùy chỉnh với các ứng dụng trong y học, khoa học vật liệu và hơn thế nữa. Trong bài viết này, chúng ta khám phá cách ESM3 hoạt động, những gì nó đã đạt được và tại sao tiến bộ này đang thay đổi cách hiểu của chúng ta về sinh học và tiến hóa.

Meet ESM3: Trí tuệ nhân tạo mô phỏng tiến hóa

ESM3 là một mô hình ngôn ngữ đa phương thức được đào tạo để hiểu và tạo ra protein bằng cách phân tích trình tự, cấu trúc và chức năng của chúng. Không giống như AlphaFold, có thể dự đoán cấu trúc của các protein hiện có, ESM3 cơ bản là một mô hình kỹ thuật protein, cho phép các nhà nghiên cứu chỉ định các yêu cầu chức năng và cấu trúc để thiết kế hoàn toàn mới các protein.

Mô hình này nắm giữ kiến thức sâu về trình tự protein, cấu trúc và chức năng cùng với khả năng tạo ra protein thông qua tương tác với người dùng. Khả năng này cho phép mô hình tạo ra các protein có thể không tồn tại trong tự nhiên nhưng vẫn có tính khả thi về mặt sinh học. Việc tạo ra một protein phát sáng xanh mới (esmGFP) là một minh chứng ấn tượng về khả năng này. Các protein phát sáng, ban đầu được phát hiện trong sứa và san hô, được sử dụng rộng rãi trong nghiên cứu y học và công nghệ sinh học. Để phát triển esmGFP, các nhà nghiên cứu đã cung cấp cho ESM3 các đặc điểm cấu trúc và chức năng chính của các protein phát sáng đã biết. Sau đó, mô hình đã tinh chỉnh thiết kế một cách lặp lại, áp dụng một phương pháp lý luận theo chuỗi suy nghĩ để tối ưu hóa trình tự. Trong khi tiến hóa tự nhiên có thể mất hàng triệu năm để sản xuất protein tương tự, ESM3 tăng tốc quá trình này để đạt được điều đó trong vài ngày hoặc vài tuần.

Quy trình thiết kế protein được thúc đẩy bởi trí tuệ nhân tạo

Dưới đây là cách các nhà nghiên cứu đã sử dụng ESM3 để phát triển esmGFP:

Kích hoạt trí tuệ nhân tạo – Ban đầu, họ nhập trình tự và gợi ý cấu trúc để hướng dẫn ESM3 hướng tới các tính năng liên quan đến phát sáng.
Tạo ra các protein mới – ESM3 đã khám phá không gian rộng lớn của các trình tự tiềm năng để sản xuất hàng nghìn ứng viên protein.
Lọc và tinh chỉnh – Các thiết kế hứa hẹn nhất đã được lọc và tổng hợp để thử nghiệm trong phòng thí nghiệm.
Xác thực trong các tế bào sống – Các protein được thiết kế bởi trí tuệ nhân tạo đã được chọn đã được biểu hiện trong vi khuẩn để xác nhận khả năng phát sáng và chức năng của chúng.

Quy trình này đã dẫn đến một protein phát sáng (esmGFP) không giống bất kỳ thứ gì trong tự nhiên.

esmGFP so với các protein tự nhiên

Điều làm cho esmGFP trở nên đặc biệt là sự khác biệt của nó so với các protein phát sáng đã biết. Trong khi hầu hết các protein GFP mới được phát hiện có sự thay đổi nhỏ so với các protein hiện có, esmGFP có độ giống hệt trình tự chỉ 58% so với họ hàng tự nhiên gần nhất của nó. Về mặt tiến hóa, sự khác biệt như vậy tương ứng với thời gian phân kỳ hơn 500 triệu năm.

Để đặt điều này vào перспектива, lần cuối cùng các protein với khoảng cách tiến hóa tương tự xuất hiện, khủng long vẫn chưa xuất hiện và sự sống đa bào vẫn còn trong giai đoạn đầu. Điều này có nghĩa là trí tuệ nhân tạo không chỉ tăng tốc tiến hóa — mà còn mô phỏng một con đường tiến hóa hoàn toàn mới, tạo ra các protein mà tự nhiên có thể không bao giờ tạo ra.

Tại sao khám phá này quan trọng

Tiến bộ này là một bước tiến quan trọng trong kỹ thuật protein và làm sâu sắc hơn sự hiểu biết của chúng ta về tiến hóa. Bằng cách mô phỏng hàng triệu năm tiến hóa chỉ trong vài ngày, trí tuệ nhân tạo đang mở ra cánh cửa cho những khả năng thú vị mới:

Khám phá thuốc nhanh hơn: Nhiều loại thuốc hoạt động bằng cách nhắm vào các protein cụ thể, nhưng việc tìm kiếm đúng loại protein là một quá trình chậm và tốn kém. Các protein được thiết kế bởi trí tuệ nhân tạo có thể tăng tốc quá trình này, giúp các nhà nghiên cứu phát hiện ra các phương pháp điều trị mới một cách hiệu quả hơn.
Giải pháp mới trong kỹ thuật sinh học: Các protein được sử dụng trong mọi thứ, từ việc phá vỡ chất thải nhựa đến việc phát hiện bệnh. Với thiết kế được thúc đẩy bởi trí tuệ nhân tạo, các nhà khoa học có thể tạo ra các protein tùy chỉnh cho chăm sóc sức khỏe, bảo vệ môi trường và thậm chí là các vật liệu mới.
Trí tuệ nhân tạo như một mô phỏng tiến hóa: Một trong những khía cạnh thú vị nhất của nghiên cứu này là nó đặt trí tuệ nhân tạo vào vị trí của một mô phỏng tiến hóa chứ không chỉ là một công cụ phân tích. Các mô phỏng tiến hóa truyền thống liên quan đến việc lặp lại các đột biến di truyền, thường mất nhiều tháng hoặc nhiều năm để tạo ra các ứng viên khả thi. ESM3, tuy nhiên, bỏ qua những hạn chế chậm này bằng cách dự đoán trực tiếp các protein có chức năng. Sự thay đổi trong cách tiếp cận này có nghĩa là trí tuệ nhân tạo không chỉ模仿 tiến hóa mà còn tích cực khám phá các khả năng tiến hóa vượt ra ngoài tự nhiên. Với đủ năng lực tính toán, tiến hóa được thúc đẩy bởi trí tuệ nhân tạo có thể khám phá ra các tính chất hóa sinh mới mà chưa từng tồn tại trong thế giới tự nhiên.

Các vấn đề đạo đức và phát triển trí tuệ nhân tạo có trách nhiệm

Mặc dù tiềm năng lợi ích của kỹ thuật protein được thúc đẩy bởi trí tuệ nhân tạo là rất lớn, công nghệ này cũng đặt ra các câu hỏi về đạo đức và an toàn. Điều gì xảy ra khi trí tuệ nhân tạo bắt đầu thiết kế các protein vượt ra ngoài sự hiểu biết của con người? Làm thế nào chúng ta đảm bảo rằng các protein này an toàn cho sử dụng y tế hoặc môi trường?

Chúng ta cần tập trung vào việc phát triển trí tuệ nhân tạo có trách nhiệm và thử nghiệm kỹ lưỡng để giải quyết những lo ngại này. Các protein được tạo ra bởi trí tuệ nhân tạo, như esmGFP, nên trải qua thử nghiệm phòng thí nghiệm rộng rãi trước khi được xem xét cho các ứng dụng trong thế giới thực. Ngoài ra, các khuôn khổ đạo đức cho sinh học được thúc đẩy bởi trí tuệ nhân tạo đang được phát triển để đảm bảo tính minh bạch, an toàn và niềm tin của công chúng.

Kết luận

Sự ra mắt của ESM3 là một phát triển quan trọng trong lĩnh vực công nghệ sinh học. ESM3 chứng minh rằng tiến hóa không nên là một quá trình thử và sai chậm chạp. Việc nén 500 triệu năm tiến hóa protein chỉ trong vài ngày mở ra một tương lai nơi các nhà khoa học có thể thiết kế các protein hoàn toàn mới với tốc độ và độ chính xác đáng kinh ngạc. Sự phát triển của ESM3 có nghĩa là chúng ta không chỉ sử dụng trí tuệ nhân tạo để hiểu sinh học mà còn để thay đổi nó. Đột phá này giúp chúng ta tiến bộ trong khả năng lập trình sinh học giống như cách chúng ta lập trình phần mềm, mở ra những khả năng mà chúng ta mới chỉ bắt đầu tưởng tượng.