Lãnh đạo tư tưởng
Từ Mã đến Chữa bệnh: Cuộc Cách mạng Trí tuệ nhân tạo Tiếp theo Cần một Tay (và Mắt)

Làm thế nào các hệ thống đại lý, kính thông minh XR và robot sẽ trao quyền cho con người – không thay thế họ
Chúng ta đang sống trong một nghịch cảnh trong trí tuệ nhân tạo.
Trên màn hình, AI là siêu nhân. Các mô hình ngôn ngữ lớn viết mã Python chức năng trong vài giây. Các hệ thống tạo ra hình ảnh và video siêu thực trong vài phút. Các hệ thống giành giải Nobel như AlphaFold đã dự đoán cấu trúc của hầu hết các protein đã biết. Những chiến thắng kỹ thuật số đang tích lũy.
Tuy nhiên, trong thế giới vật lý của nghiên cứu sinh học, quá trình khám phá vẫn còn thủ công. Chúng ta không thực sự cảm nhận được AI đang tăng tốc khoa học hoặc y học, ít nhất là chưa. Các số liệu tiết lộ độ sâu của vấn đề. Một cuộc khảo sát mang tính bước ngoặt của Nature về hơn 1.500 nhà khoa học đã发现 rằng hơn 70% đã thử và không thể tái tạo các thí nghiệm của một nhà nghiên cứu khác. Thậm chí còn đáng lo ngại hơn: hơn một nửa không thể tái tạo công việc của chính họ. Trong sinh học ung thư cụ thể, một dự án tái tạo khả năng trong tám năm đã tìm thấy rằng chỉ 40% các phát hiện có tác động cao có thể được tái tạo và 68% các thí nghiệm thiếu tài liệu đủ để thậm chí cố gắng tái tạo.
Đây là bí mật bẩn của khoa học hiện đại: chúng ta có một vấn đề về thu thập kiến thức, không chỉ là vấn đề khám phá. Các chi tiết thí nghiệm quan trọng sống trong đầu các nhà nghiên cứu, không trong các bài báo. Các giao thức trôi dạt. Kiến thức ngầm biến mất khi các sinh viên tốt nghiệp. Các hệ thống AI được đào tạo trên văn học đã xuất bản kế thừa tất cả các khoảng trống này.
Vấn đề cơ bản là trong khi một AI có thể thiết kế một protein mới cho liệu pháp ung thư trong một mô phỏng kỹ thuật số, nó không thể nhặt một ống nghiệm để kiểm tra nó. Nó không thể điều hướng thực tế lộn xộn, khó dự đoán của một phòng thí nghiệm ướt để xác thực giả thuyết của chính nó. Nó không thể xem tay của một nhà khoa học có kinh nghiệm và học các kỹ thuật tinh vi làm cho các thí nghiệm hoạt động.
“Khoảng cách thực hiện” này là nút thắt lớn nhất ngăn cản cuộc cách mạng AI trở thành một cuộc cách mạng y tế. Trong khi hầu hết các công ty robot vẫn còn bận rộn dạy máy móc gấp quần áo hoặc nạp máy rửa bát, họ đang tụt lại phía sau về các khả năng chuyển đổi thực sự của những tiến bộ này trong các lĩnh vực như y học.
Để giải quyết vấn đề này, chúng ta phải đi beyond các rô-bốt trò chuyện và hướng tới các nhà khoa học đồng nghiệp AI, các hệ thống đại lý bắc cầu thế giới kỹ thuật số và thế giới vật lý, đẩy vượt quá lập kế hoạch và mã hóa và vào thực hiện thực tế. Tại Stanford, chúng tôi đang phát triển LabOS, một khuôn khổ AI kỹ thuật số-vật lý thể hiện cách các đại lý AI, kính thông minh XR và robot hợp tác có thể hợp nhất để đóng vòng lặp này, biến các thí nghiệm khoa học thành một cuộc trò chuyện hợp tác giữa con người và máy, đồng thời tự động thu thập kiến thức hiện đang bị mất.
Đường chia cắt vĩ đại: Tại sao AI cần “Mắt” và “Tay”
Nhiều chiến thắng AI đáng chú ý nhất đã xảy ra ở nơi môi trường hoàn toàn kỹ thuật số: kho mã, tập dữ liệu được kiểm duyệt hoặc các điểm chuẩn mô phỏng (trong đó AI cạnh tranh để chạy một doanh nghiệp ảo hoặc đầu tư kỹ thuật số vào cổ phiếu).
Phòng thí nghiệm ướt khác. Sinh học và nói chung, khám phá khoa học là một quá trình rất ồn ào. Các công cụ trôi dạt, các nhà vận hành tự phát, và “giao thức” thường sống một phần trong đầu mọi người. Sự khác biệt giữa một kết quả sạch và một lần chạy thất bại có thể là một góc pipetting, một mẫu vortexing, một sự thay thế thuốc thử hoặc một ủ chạy dài 10 phút. Những chi tiết ngữ cảnh này hiếm khi được đưa vào một bài báo và chúng chính xác là những gì một mô hình AI cần nếu nó sẽ tổng quát hóa vượt quá một tập dữ liệu.
That là lý do tại sao AI cấp phòng thí nghiệm cần mắt (để nhận thức những gì đang xảy ra trong ngữ cảnh), tay (để tiêu chuẩn hóa và tự động hóa các bước biến đổi cao) và bộ nhớ (để ghi lại những gì thực sự đã xảy ra). Nếu không có những khả năng này, các mô hình có thể đề xuất những gì cần làm, nhưng chúng không thể đáng tin cậy dịch các khuyến nghị thành thực hiện vật lý được xác thực hoặc giải thích thất bại khi thực tế khác với kế hoạch.
Beyond Chatbots: Từ Copilots đến Co-Scientists
Thuật ngữ “AI đại lý” đôi khi được sử dụng lỏng lẻo. Trong các thiết lập sinh học, nó nên có nghĩa là một điều gì đó chính xác: một hệ thống có thể thực hiện một mục tiêu (ví dụ: “tối ưu hóa hiệu quả chỉnh sửa gene CRISPR trong khi giảm thiểu các mục tiêu ngoài”), chia nhỏ nó thành một chuỗi các nhiệm vụ, thực hiện các nhiệm vụ đó trên các công cụ, đánh giá kết quả và thích nghi với kế hoạch dưới các ràng buộc và với việc ra quyết định có thể kiểm toán.
Điều này quan trọng vì các công việc nghiên cứu không phải là một cuộc gọi mô hình đơn. Chúng là các đường ống đầu cuối bao gồm việc hình thành giả thuyết, thiết kế thí nghiệm, xử lý dữ liệu, kiểm tra thống kê và giải thích. Tư duy gần đây trong khám phá thuốc đã bắt đầu nhấn mạnh các hệ thống đại lý có thể mở rộng các đường ống này thay vì chỉ tăng tốc các bước riêng lẻ (ví dụ: thảo luận của Unite.AI về các đại lý trong khám phá phân tử nhỏ).
Trong kỹ thuật phần mềm, chúng ta đã thấy bằng chứng thực nghiệm ban đầu rằng các copilot AI có thể tăng năng suất của nhà phát triển. Trong sinh học, cơ hội tương đương không chỉ là viết mã, mà là viết và xác thực giao thức, cấu trúc dữ liệu, giám sát thực hiện và đóng vòng lặp giữa dự đoán và đo lường, kết nối AI với các nhà khoa học con người trong các phòng thí nghiệm.
LabOS: Khi AI Chạy trên Hệ điều hành cho Phòng thí nghiệm của Ngày mai
Trong công việc của chúng tôi tại Stanford về AI4Science, bao gồm các copilot chỉnh sửa gene như CRISPR-GPT và các hệ thống đồng thực hiện AI-XR như LabOS giúp các nhà khoa học trong các phòng thí nghiệm sinh học và khoa học vật liệu, chúng tôi đã khám phá một sự thay đổi kiến trúc:
1. Thiết kế một “hệ điều hành phòng thí nghiệm” đầu cuối kết nối một phòng thí nghiệm kỹ thuật số (khô) với một phòng thí nghiệm vật lý (ướt).
Giả định là đơn giản: nếu một cuốn sổ tay phòng thí nghiệm là bộ nhớ của khoa học, thì một hệ điều hành phòng thí nghiệm nên là lớp thực hiện, thu thập ý định, dịch nó thành hành động, quan sát kết quả và biến mọi lần chạy thành kiến thức có cấu trúc.

Hình. Một cái nhìn khái niệm về LabOS liên kết một vòng lặp phòng thí nghiệm kỹ thuật số tự tiến hóa (lập kế hoạch, mã hóa, phê bình, tạo công cụ) với một vòng lặp phòng thí nghiệm ướt của con người-AI (tự ghi lại, thu thập kiến thức, hướng dẫn XR và tích hợp robot).
2. AI trong Phòng thí nghiệm Kỹ thuật số – Lập kế hoạch và Xây dựng Công cụ Tự tiến hóa
Trong phòng thí nghiệm kỹ thuật số (khô), chúng ta có thể để AI làm những gì nó đã làm tốt: tìm kiếm, tổng hợp và đề xuất. Nhưng chúng ta cũng muốn nó tự cải thiện. Không bằng cách “huyễn hoặc khoa học mới”, mà bằng cách học các công cụ và công việc tốt hơn từ phản hồi.
Một vòng lặp phòng thí nghiệm kỹ thuật số thực tế có thể được khung như bốn giai đoạn lặp lại:
- Lập kế hoạch (giả thuyết + thiết kế): đề xuất giả thuyết, chọn biến thí nghiệm, dự đoán các yếu tố混 hợp và chỉ định các điểm cuối đo lường.
- Mã hóa (thực hiện): tạo hoặc thích nghi các tập lệnh phân tích, đường ống mô phỏng và mẫu điều khiển công cụ khi phù hợp.
- Critic agent (lý luận + đánh giá): kiểm tra các giả định, kiểm tra sức mạnh thống kê, đề xuất các biện pháp kiểm soát và cờ các chế độ thất bại có thể.
- Tạo công cụ (tìm kiếm + phát triển): khi công việc thiếu một thành phần (một trình phân tích, một quy trình QC, một bảng điều khiển), xây dựng nó và thêm nó trở lại vào bộ công cụ.
3. AI trong Phòng thí nghiệm Vật lý – AI Với “Mắt” (Kính XR) và “Tay” (Robot)
Phòng thí nghiệm vật lý là nơi hệ thống либо kiếm được sự tin tưởng – hoặc mất nó. Mục tiêu là không thay thế nhà khoa học, mà là giảm ma sát và lỗi trong khi tăng khả năng quan sát.
Chúng tôi xem vòng lặp phòng thí nghiệm vật lý như bốn khả năng bổ sung:
- Tự ghi lại và tài liệu: thu thập hành động, dấu thời gian, cài đặt công cụ và偏差 tự động, để tài liệu không phải là một ý nghĩ sau.
- Thu thập kiến thức cho thực hiện nhanh và tái tạo: chuyển các lần chạy thành các artifact có thể truy vấn (phiên bản giao thức, tập hợp tham số, kết quả QC) được căn chỉnh với các nguyên tắc quản lý dữ liệu như FAIR.
- Hướng dẫn ngôn ngữ-vision thời gian thực qua kính thông minh XR: sử dụng các mô hình đa phương thức để giải thích cảnh (những gì mà người vận hành đang làm, loại thuốc thử nào trong tay) và cung cấp hướng dẫn từng bước và kiểm tra an toàn. AR / XR đã chứng minh giá trị trong các công việc vật lý có rủi ro cao như hướng dẫn thí nghiệm (LabOS, Stanford, Princeton, trong sự hợp tác với NVIDIA).
- Tích hợp robot / cobot cho tự động hóa: tiêu chuẩn hóa các bước lặp lại, cho phép giao hàng an toàn và giảm biến đổi. Các nền tảng cho các công việc mô phỏng-thực (ví dụ NVIDIA Isaac) và xử lý AI thời gian thực tại cạnh như truyền trực tuyến kính thông minh và tương tác con người-AI trong LabOS là các lớp启 động quan trọng.
Kiến trúc này phù hợp với một hướng rộng hơn trong lĩnh vực: “phòng thí nghiệm tự lái” hoặc tự động hóa kết hợp với học máy để lập kế hoạch thí nghiệm tiếp theo. Những gì LabOS thêm vào là một lớp giao diện con người chặt chẽ hơn, để tự chủ không có chi phí minh bạch.
Tại sao Lab-Grade AI Không chỉ là “AI trên Tập dữ liệu”
Các hệ thống AI cho siêu trí tuệ sinh học / khoa học thường trông ấn tượng trong đánh giá hồi cứu hoặc tham gia các kỳ thi, và sau đó hoạt động dưới mức trong phòng thí nghiệm vật lý. Lý do là hiếm khi là một lỗi đơn. Nó thường là một sự không phù hợp giữa các giả định của mô hình và thực tế của phòng thí nghiệm.
Ba khoảng trống xuất hiện lặp lại:
- Khoảng trống ngữ cảnh: các tập dữ liệu thường bỏ qua các biến ngữ cảnh mà các nhà vận hành biết quan trọng (nhiệt độ trượt, số lô thuốc thử, sự偏差 giao thức tinh vi).
- Khoảng trống hành động: nhiều hệ thống AI có thể đề xuất những gì cần làm, nhưng không thể đáng tin cậy dịch các khuyến nghị thành các bước vật lý được xác thực.
- Khoảng trống phản hồi: nếu không có phản hồi cấu trúc, chất lượng cao từ thực hiện, các mô hình không thể học nơi chúng thất bại – và các nhà khoa học không thể kiểm toán tại sao.
Đóng các khoảng trống này ít hơn về việc phát minh một kiến trúc mạng nơ-ron mới, mà về việc xây dựng các công cụ, giao diện và hợp đồng dữ liệu làm cho phòng thí nghiệm có thể đọc được cho máy, và cho phép AI nhìn thấy và làm việc với con người.
Thiết kế Tin cậy: An toàn và Quản lý cho AI Có thể Hành động
AI đại lý trong nghiên cứu khám phá không chỉ nâng cao các mối quan ngại quen thuộc về độ chính xác. Nó giới thiệu các chế độ thất bại mới vì nó có thể hành động. Trong một phòng thí nghiệm, hành động có nghĩa là tiềm năng cho浪 phí, tổn hại hoặc kết luận lừa dối, đặc biệt khi các thí nghiệm cho ăn vào các giả thuyết lâm sàng.
Một tư duy hữu ích là để đối xử với một ngăn xếp phòng thí nghiệm được kích hoạt AI như một hệ thống xã hội-kỹ thuật cần đảm bảo. Một số khuôn khổ hiện có giúp đỡ, nhưng chúng phải được dịch sang thực tế phòng thí nghiệm:
- Quản lý rủi ro như một thực hành liên tục: khuôn khổ quản lý rủi ro AI của NIST (AI RMF 1.0) cung cấp một từ vựng thực tế để ánh xạ, đo lường và quản lý rủi ro AI trên toàn vòng đời.
- Đồng bộ quy định cho AI y tế liền kề: công việc của FDA về Phần mềm AI / ML như một Thiết bị Y tế (SaMD), bao gồm Kế hoạch Hành động và hướng dẫn liên quan, cung cấp một cái nhìn cụ thể về những gì “thực hành tốt” trông như thế nào khi AI tác động đến chăm sóc bệnh nhân.
Đối với các lĩnh vực như chỉnh sửa gene và các lĩnh vực có hậu quả cao khác, quản lý là một cuộc trò chuyện toàn cầu. Các khuyến nghị đang được thảo luận về chỉnh sửa gene người, để nhấn mạnh nhu cầu về các cơ chế giám sát phù hợp và quản lý có trách nhiệm, như những khuyến nghị được đưa ra bởi Hiệp hội Gene và Cell Therapy Mỹ, hoặc ASGCT. Các hệ thống như LabOS nên được thiết kế để làm cho việc tuân thủ dễ dàng hơn, không khó hơn.
Danh sách Kiểm tra: Kiểm soát An toàn cho Các nhà khoa học Đồng nghiệp AI An toàn cho Khám phá Khoa học
Theo quan điểm của chúng tôi, một hệ điều hành phòng thí nghiệm an toàn nên thực hiện ít nhất các thiết kế sau:
- Nguyên nhân theo mặc định: mọi tập dữ liệu, phiên bản giao thức và đầu ra mô hình nên có thể truy vết đến đầu vào và dấu thời gian.
- Tự chủ có giới hạn: hệ thống nên có các quyền rõ ràng (những gì nó có thể làm mà không cần xác nhận) và các quy tắc nâng cấp (khi nó phải hỏi).
- Quay lại an toàn và suy giảm dần: khi các cảm biến hoặc luồng dữ liệu bị lỗi, hoặc không chắc chắn là cao, hệ thống nên quay lại một chế độ an toàn hơn, đơn giản hơn.
- Xác thực liên tục: các dự đoán trong silico nên được ghép nối với xác thực phòng thí nghiệm vật lý; các lần chạy phòng thí nghiệm vật lý nên bao gồm các cổng QC trước khi các kết luận truyền xuống dòng các mô hình / đại lý trong thế giới kỹ thuật số.
- An ninh và nhận thức sử dụng kép: bảo vệ cơ sở hạ tầng phòng thí nghiệm khỏi sự can thiệp.
Empower Humans Everywhere: Liệu Các nhà khoa học Đồng nghiệp AI Có thể San bằng Sân chơi?
Một trong những lời hứa hấp dẫn nhất của một “nhà khoa học đồng nghiệp AI” là không chỉ là tốc độ cho các tổ chức hàng đầu, mà là khả năng tiếp cận cho mọi người. Hãy xem những gì hiện đang hạn chế các phòng thí nghiệm nhỏ, các công ty khởi nghiệp và các phòng khám / trung tâm từ xa / nông thôn / khu vực:
- Truy cập hạn chế vào chuyên môn đặc biệt cho các giao thức và công cụ tiêu chuẩn vàng.
- Chi phí đào tạo, lỗi và làm lại cao hơn.
- Công cụ phân mảnh: sổ tay, bảng tính, nhật ký công cụ và tập lệnh phân tích hiếm khi kết nối sạch sẽ.
Một hệ thống có thể hướng dẫn thực hiện trong ngữ cảnh (thông qua kính XR), thu thập những gì đã xảy ra tự động và đề xuất bước tiếp theo tốt nhất dựa trên các lần chạy trước có thể làm cho các xét nghiệm tiên tiến hơn tái tạo được trên các trang web. Về nguyên tắc, nó cũng có thể hỗ trợ nghiên cứu lâm sàng phân tán nơi các giao thức phải được thực hiện nhất quán, ngay cả khi tài nguyên khác nhau.
Lịch trình: Khi nào Mỗi nhà khoa học và Bác sĩ sẽ Nhận được một Đồng nghiệp?
Ngắn gọn, chúng tôi đang gần hơn nhiều so với hầu hết mọi người nghĩ về một số nhiệm vụ có giá trị cao, có tần suất cao (như sản xuất một loại thuốc đáng tin cậy trong phòng thí nghiệm) và xa hơn những gì hầu hết các bản demo ngụ ý về những người khác (như AI hoàn toàn giải quyết các vấn đề lớn như ung thư hoặc Alzheimer). Một bản đồ đường thực tế trông như thế này:
- Gần hạn (trong 1 năm): Các đồng nghiệp công việc giảm tải hành chính: soạn thảo giao thức, tổng hợp văn học, mẫu phân tích và báo cáo QC tự động. Yếu tố hạn chế là tích hợp, không phải khả năng mô hình.
- Trung hạn (1-2 năm): Các hệ thống đồng thực hiện trong phòng thí nghiệm: hướng dẫn kính XR, tài liệu tự động và robot chọn lọc cho các bước biến đổi cao. Niềm tin sẽ phụ thuộc vào các đường mòn kiểm toán và thiết kế con người trong vòng lặp chặt chẽ.
- Dài hạn (3+ năm): Các nhà nghiên cứu đồng nghiệp xuyên lĩnh vực kết nối khám phá với dịch: liên kết dữ liệu phòng thí nghiệm với các điểm cuối lâm sàng, theo dõi tín hiệu an toàn, và giúp thiết kế các thử nghiệm – đồng thời tuân thủ các kỳ vọng quy định và đạo đức.
Từ Mã đến Chữa bệnh: Con đường Tiếp theo để Khám phá Khoa học 1000x
LabOS là một nỗ lực để trả lời một câu hỏi đơn giản: điều gì nếu một thí nghiệm có thể được chạy như một cuộc trò chuyện, nơi ý định, thực hiện và bằng chứng được kết nối từ đầu đến cuối? Nếu chúng ta xây dựng những hệ thống này tốt, chúng có thể giúp giải quyết khoảng trống dịch mà làm chậm sinh học và nhiều lĩnh vực khoa học vật lý (ví dụ: khoa học vật liệu). Nếu chúng ta xây dựng chúng kém, chúng sẽ khuếch đại tính không tái tạo và tạo ra các rủi ro an toàn mới.
Công việc quan trọng nhất trong vài năm tới sẽ là cơ bản: các giao diện dữ liệu và thiết bị tiêu chuẩn hóa thông qua việc xây dựng hệ điều hành (giống như iOS chạy tất cả loại ứng dụng), xây dựng các điểm chuẩn AI bao gồm thực hiện và không chắc chắn (như điểm chuẩn LabSuperVision trong LabOS), và bắt đầu triển khai trong thế giới thực khuyến khích đổi mới trong khi bảo vệ tính toàn vẹn của nghiên cứu và bệnh nhân.
Đối với các nhà nghiên cứu và bác sĩ, câu hỏi không phải là liệu AI sẽ vào phòng thí nghiệm. Nó đã có. Câu hỏi là liệu chúng ta sẽ tích hợp nó như một tập hợp các công cụ không kết nối hoặc như một hệ thống đáng tin cậy, được thiết kế cho thực tế của khoa học sinh học.
Đọc thêm và nguồn
- Khảo sát tái tạo (Nature, 2016): https://www.nature.com/articles/533452a
- Bài báo đồng nghiệp về CRISPR-GPT (Nature Biomedical Engineering): https://www.nature.com/articles/s41551-025-01463-z
- Tin tức Stanford Medicine về CRISPR-GPT (2025): https://med.stanford.edu/news/all-news/2025/09/ai-crispr-gene-therapy.html
- Bản in trước của LabOS (arXiv): https://arxiv.org/abs/2510.14861
- Trang web LabOS và điểm chuẩn LabSuperVision: https://ai4lab.stanford.edu
- Khung quản lý rủi ro AI của NIST (AI RMF 1.0): https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-1.pdf
- Tổng quan FDA về Phần mềm AI / ML như một Thiết bị Y tế: https://www.fda.gov/medical-devices/software-medical-device-samd/artificial-intelligence-software-medical-device
- Nguyên tắc dữ liệu FAIR (Scientific Data, 2016): https://doi.org/10.1038/sdata.2016.18
- Unite.AI về các nút thắt trong khám phá thuốc phân tử nhỏ: https://www.unite.ai/how-ai-is-breaking-down-the-bottlenecks-in-small-molecule-drug-discovery/
- Unite.AI về AI và phẫu thuật robot: https://www.unite.ai/how-ai-is-ushering-in-a-new-era-of-robotic-surgery/












