Zdravotnictví

Ginkgo Datapoints představuje VCPI: Odvážný plán na řešení problému dat v objevování léků pomocí AI

mm

Already roky, AI v objevování léků byla omezena deceptivně jednoduchým problémem: data nejsou dostatečně kvalitní. Hory sekvencí, studií s kombinovanými perturbacemi a těch smíšených buněčných experimentů vytvářely dojem pokroku, ale skutečné průlomy se nikdy neobjevily. Místo jasnosti toto pole produkovalo hluk. Místo reprodukovatelnosti produkovalo drift. A místo přesných, farmakologicky specifických měření, která jsou potřebná pro výcvik spolehlivých virtuálních buněčných modelů, produkovala data optimalizovaná více pro měřítko než pro vědeckou integritu.

To je prostředí, do kterého Ginkgo Datapoints spouští Iniciativu virtuální buněčné farmakologie (VCPI) — projekt, který slibuje lepší data, vytvořená speciálně pro AI modely, které se snaží předpovědět, jak reálné molekuly podobné lékům ovlivňují reálné biologické systémy. Oficiální oznámení společnosti zdůrazňuje, že VCPI vygeneruje více než 12 miliard datových bodů a profiluje 100 000 sloučenin, čímž založí první standardizovanou datovou sadu pro virtuální buněčnou farmakologii.

Proč “Více dat” selhalo

V blogovém příspěvku, který představuje VCPI, Ginkgo používá analogii, která dokonale zachycuje špatný směr tohoto oboru. Představte si, že házíte hrst pilulek do klece myší — a pak se snažíte zjistit, která myš snědla co. Teď to zmenšete na milion myší v jedné obrovské kleci. To je základní chyba za experimenty s farmakologií buněčných poolů. Tyto experimenty generují působivá množství dat, ale jejich základní design brání čisté atribuci mezi sloučeninou a fenotypem.

Problém není technologie; je to experimentální architektura. Předpoklad, že větší datové sady automaticky učí lepší modely, se ukázal jako falešný. Blog tento způsob myšlení nazývá “datovou závislostí” a tvrdí, že bez dobře strukturovaných, vysokofrekvenčních vstupů se i nejmodernější AI naučí špatným vzorcům.

VCPI představuje ostrý odchod od této logiky. Místo oslavování velikosti se soustředí na biologickou stopovatelnost, experimentální přísnost a řízenou strukturu, která je potřebná pro to, aby AI skutečně naučila farmakologii.

Jak VCPI přestavuje datový pipeline

Místo toho, aby se spoléhala na experimenty s buněčnými pooly, VCPI používá DRUG-seq, vysokokapacitní metodu sekvenování RNA, při které je každá sloučenina ošetřena v izolované barevně kódované jamce. To umožňuje Ginkgo měřit léčebné odpovědi s mnohem čistším signálem než nabízejí poolované návrhy. Podle tiskové zprávy může automatizační infrastruktura společnosti běžet více než 100 kompletních 384-jamkových desek týdně, generovat miliony vysoce kvalitních RNA měření v průmyslovém měřítku.

Stejně důležité je zavedení V-Ref293, nově vyvinuté, standardizované referenční buněčné linie. Místo toho, aby každý laboratoř běžel svou vlastní mutovanou, odchýlenou verzi stejné buněčné linie, VCPI vytváří univerzální biologickou bázi — “organickou dvojčata” k nově se objevující třídě virtuálních buněk. Tím se eliminuje jeden z dlouhodobých zdrojů nereprodukovatelnosti ve farmakogenomice a poskytuje stabilní skutečnost, kterou AI modely zoufale potřebují.

V rámci této iniciativy Ginkgo otevírá dveře komunitou budované datové sadě s několika definujícími komponenty:

  • Otevřená účast pro výzkumníky, farmaceutické týmy a vývojáře AI
  • Bezplatné high-throughput RNA profilování pro předložené sloučeniny
  • Nepovinné embargo nebo trvalý proprietární přístup pro přispěvatele
  • Měsíční datové vydání formované komunitním hlasováním
  • Možnosti sdílení modelů, prioritizace sloučenin a časný přístup “superuživatelů”

Komunitou budovaný model, ne datový dump

Jedním z nejneobvyklejších aspektů VCPI je rozhodnutí spustit předtím, než datová sada existuje. Místo toho, aby nahráli dokončený zdroj, Ginkgo žádá vědeckou komunitu, aby pomohla určit, které sloučeniny jsou nejvíce důležité, a aby spolupracovala v reálném čase, jak datová sada roste.

Tento přístup také snižuje riziko účasti. Rané biotechnologické společnosti mohou předložit sloučeniny a získat skutečná farmakologická data, aniž by spálily drahocenný rozpočet na high-throughput screening. Týmy AI mohou zajistit, aby datová sada odrážela perturbace, které skutečně potřebují pro výcvik modelů. A akademické laboratoře mohou přispívat, zatímco si stále zachovávají možnost 90denního exkluzivního okna.

Struktura transformuje generování dat do participativního vědeckého procesu — ne statického produktu.

Co to znamená pro budoucnost bio-AI

Širší implikace VCPI sahají za Ginkgo nebo jakoukoli jednotlivou virtuální buněčnou iniciativu. Aby se virtuální buněčné modely staly vědecky důvěryhodnými, musí být trénovány na datech, která jsou reprodukovatelná, léčebně specifická a ukotvená ve stabilní biologické referenci. Bez této základny bude AI pokračovat v halucinacích, špatných předpovědích nebo nadměrném přizpůsobení se artefaktům.

Iniciativy jako VCPI signalizují posun v tom, jak toto pole myslí o datech samých. Experimentální design se stává stejně důležitým jako architektura modelu. Reprodukovatelnost se vrací jako centrální požadavek místo volitelného ideálu. A komunitou vedené, otevřené infrastruktury projekty začínají předhánět uzavřené proprietární datové sady ve své schopnosti urychlit inovace.

Pokud se virtuální buňky nakonec stanou spolehlivými predikčními motory — nástroji, které pomáhají řadit sloučeniny, označovat toxicity nebo osvětlit dráhy, než se člověk dotkne pipety — bude to proto, že projekty jako VCPI vytvořily strukturované, důvěryhodné datové prostředí, které potřebují k růstu.

Prioritizando lepší data než prostě více dat, Ginkgo předefinuje základy biologie založené na AI. VCPI ne pouze reaguje na datovou krizi v objevování léků; nastavuje scénu pro novou éru, ve které biologické experimenty a AI tréninkové pipeline evoluují společně, otevřeně a s účelem.

Antoine je vizionářský líder a spoluzakladatel Unite.AI, který je poháněn neotřesitelnou vášní pro formování a propagaci budoucnosti umělé inteligence a robotiky. Jako sériový podnikatel věří, že umělá inteligence bude mít na společnost stejně disruptivní vliv jako elektřina, a často je chycen při tom, že vypráví o potenciálu disruptivních technologií a AGI.

As a futurist, je zasvěcen zkoumání toho, jak tyto inovace budou tvarovat náš svět. Kromě toho je také zakladatelem Securities.io, platformy zaměřené na investice do špičkových technologií, které předefinují budoucnost a přetvarují celé sektory.