Connect with us

Ginkgo Datapoints Ra Mắt VCPI: Một Kế Hoạch Táo Bạo Để Giải Quyết Vấn Đề Dữ Liệu Của Khám Phá Thuốc AI

Y tế

Ginkgo Datapoints Ra Mắt VCPI: Một Kế Hoạch Táo Bạo Để Giải Quyết Vấn Đề Dữ Liệu Của Khám Phá Thuốc AI

mm

Trong nhiều năm, AI trong khám phá thuốc đã bị hạn chế bởi một vấn đề đơn giản nhưng tinh vi: dữ liệu không đủ tốt. Những ngọn núi dữ liệu trình tự, nghiên cứu gây rối hỗn hợp và các thí nghiệm tế bào hỗn hợp đã tạo ra ấn tượng về tiến bộ mà không mang lại những đột phá thực sự., nhưng bước nhảy dự đoán mà các nhà phát triển thuốc mong đợi đã không bao giờ xuất hiện. Thay vào đó, lĩnh vực này đã tạo ra tiếng ồn thay vì sự rõ ràng. Thay vào đó, nó tạo ra sự trôi thay vì khả năng tái tạo. Và thay vào đó, các phép đo chính xác, cụ thể về dược lý học cần thiết để đào tạo các mô hình tế bào ảo đáng tin cậy, nó tạo ra các tập dữ liệu được tối ưu hóa nhiều hơn cho quy mô hơn là tính toàn vẹn khoa học.

Đây là môi trường mà Ginkgo Datapoints đang ra mắt Sáng kiến Dược lý Tế bào Ảo (VCPI) — một dự án không chỉ hứa hẹn nhiều dữ liệu hơn mà còn nhằm cung cấp dữ liệu tốt hơn, được thiết kế dành riêng cho các mô hình AI cố gắng dự đoán cách các phân tử thuốc giống thực tế ảnh hưởng đến các hệ thống sinh học thực sự. Thông báo chính thức của công ty nhấn mạnh rằng VCPI sẽ tạo ra hơn 12 tỷ điểm dữ liệu và tạo hồ sơ cho 100.000 hợp chất, thiết lập bộ dữ liệu dược lý tiêu chuẩn đầu tiên cho mô hình hóa tế bào ảo.

Tại Sao “Nhiều Dữ Liệu” Thất Bại

Trong bài đăng trên blog giới thiệu VCPI, Ginkgo sử dụng một ẩn dụ mà hoàn hảo nắm bắt được quỹ đạo bị sai lệch của lĩnh vực này. Hãy tưởng tượng ném một nắm thuốc vào một lồng chuột — sau đó cố gắng tìm ra chuột nào ăn gì. Bây giờ hãy nhân nó lên thành một triệu chuột trong một lồng khổng lồ. Đó là điểm yếu cốt lõi đằng sau các thí nghiệm dược lý học tế bào đơn hỗn hợp. Chúng tạo ra số lượng dữ liệu ấn tượng, nhưng thiết kế cơ bản ngăn cản việc quy kết sạch giữa hợp chất và kiểu hình.

Vấn đề không phải là công nghệ; nó là kiến trúc thí nghiệm. Giả định rằng các tập dữ liệu lớn hơn vốn dĩ dạy cho các mô hình tốt hơn đã chứng minh là sai. Bài đăng trên blog thẳng thắn gọi cách nghĩ này là “nghiện dữ liệu”, lập luận rằng nếu không có đầu vào có cấu trúc tốt, có tín hiệu cao, thì ngay cả AI tiên tiến nhất cũng sẽ học các mẫu sai.

VCPI đại diện cho một sự thay đổi sắc nét khỏi logic này. Thay vào việc ca ngợi quy mô, nó tập trung vào khả năng theo dõi sinh học, sự nghiêm ngặt của thí nghiệm và cấu trúc được kiểm soát cần thiết để AI thực sự học dược lý.

Làm Thế Nào VCPI Xây Lại Đường Ống Dữ Liệu

Thay vào việc dựa vào các xét nghiệm tế bào đơn hỗn hợp, VCPI sử dụng DRUG-seq, một phương pháp trình tự RNA-bulk cao năng lượng trong đó mỗi hợp chất được xử lý trong một giếng mã vạch cách ly. Điều này cho phép Ginkgo đo lường các phản ứng cụ thể của điều trị với tín hiệu sạch hơn nhiều so với các thiết kế hỗn hợp cung cấp. Theo thông cáo báo chí, cơ sở hạ tầng tự động hóa của công ty có thể chạy hơn 100 đĩa 384 giếng đầy đủ mỗi tuần, tạo ra hàng triệu phép đo RNA có độ trung thực cao với quy mô công nghiệp.

Cũng quan trọng không kém là việc giới thiệu V-Ref293, một dòng tế bào tham chiếu tiêu chuẩn mới được thiết kế. Thay vào việc mỗi phòng thí nghiệm chạy phiên bản đột biến, trôi của cùng một dòng tế bào, VCPI tạo ra một baseline sinh học chung — một “song sinh hữu cơ” cho lớp tế bào ảo mới nổi. Điều này loại bỏ một trong những nguồn gốc lâu dài của sự không tái tạo trong dược lý học di truyền và cung cấp sự thật cơ bản ổn định mà các mô hình AI cần thiết.

Dưới sáng kiến này, Ginkgo đang mở cửa một tập dữ liệu được điều khiển bởi cộng đồng với một số thành phần định nghĩa:

  • Tham gia mở cho các nhà nghiên cứu, nhóm dược phẩm và nhà phát triển AI
  • Làm hồ sơ RNA cao năng lượng miễn phí cho các hợp chất được gửi
  • Quyền truy cập độc quyền tùy chọn hoặc vĩnh viễn cho các nhà đóng góp
  • Phát hành dữ liệu hàng tháng được định hình bởi bỏ phiếu của cộng đồng
  • Cơ hội chia sẻ mô hình, ưu tiên hợp chất và trạng thái “siêu người dùng” sớm

Một Mô Hình Xây Dựng Bởi Cộng Đồng, Không Phải Là Một Đổ Dữ Liệu

Một trong những khía cạnh kỳ lạ nhất của VCPI là quyết định ra mắt trước khi tập dữ liệu tồn tại. Thay vào việc tải lên một tài nguyên hoàn chỉnh, Ginkgo đang yêu cầu cộng đồng khoa học giúp xác định các hợp chất nào quan trọng nhất và cộng tác trong thời gian thực khi tập dữ liệu phát triển.

Cách tiếp cận này cũng giảm thiểu rủi ro tham gia. Các công ty sinh học giai đoạn đầu có thể gửi hợp chất và nhận dữ liệu dược lý thực tế mà không tốn ngân sách quý giá vào sàng lọc cao năng lượng. Các nhóm AI có thể đảm bảo rằng tập dữ liệu phản ánh các sự xáo trộn mà họ thực sự cần cho đào tạo mô hình. Và các phòng thí nghiệm học thuật có thể đóng góp trong khi vẫn giữ được khả năng của một cửa sổ độc quyền 90 ngày.

Cấu trúc này biến việc tạo dữ liệu thành một quá trình khoa học tham gia — không phải là một sản phẩm tĩnh.

Điều Này Có Nghĩa Là Gì Cho Tương Lai Của Bio-AI

Các ý nghĩa rộng lớn hơn của VCPI vượt ra ngoài Ginkgo hoặc bất kỳ sáng kiến tế bào ảo nào. Để các mô hình tế bào ảo trở nên đáng tin cậy về mặt khoa học, chúng phải được đào tạo trên dữ liệu có thể tái tạo, cụ thể cho điều trị và gắn với một tham chiếu sinh học ổn định. Nếu không có nền tảng này, AI sẽ tiếp tục ảo giác, dự đoán sai hoặc quá phù hợp với các hiện tượng.

Các sáng kiến như VCPI báo hiệu một sự thay đổi trong cách lĩnh vực này nghĩ về dữ liệu. Thiết kế thí nghiệm đang trở nên quan trọng như kiến trúc mô hình. Tính tái tạo đang trở lại như một yêu cầu trung tâm thay vì một lý tưởng tùy chọn. Và các dự án cơ sở hạ tầng mở, được điều khiển bởi cộng đồng đang bắt đầu vượt qua các tập dữ liệu độc quyền đóng trong khả năng của chúng để tăng tốc đổi mới.

Nếu các tế bào ảo cuối cùng trở thành các động cơ dự đoán đáng tin cậy — các công cụ giúp xếp hạng hợp chất, cờ hiệu độc tính hoặc làm sáng tỏ các con đường trước khi con người chạm vào pipette — nó sẽ là vì các dự án như VCPI đã tạo ra môi trường dữ liệu có cấu trúc, đáng tin cậy mà chúng cần để phát triển.

Bằng cách ưu tiên dữ liệu tốt hơn so với chỉ đơn giản là nhiều dữ liệu, Ginkgo đang tái định nghĩa các nền tảng của sinh học được hỗ trợ bởi AI. VCPI không chỉ phản ứng với cuộc khủng hoảng dữ liệu trong khám phá thuốc; nó thiết lập sân khấu cho một kỷ nguyên mới nơi các thí nghiệm sinh học và các đường ống đào tạo AI phát triển cùng nhau, một cách cởi mở và có mục đích.

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.