Connect with us

Ginkgo Datapoints AvtÀcker VCPI: En DjÀrv Plan för att Fixa AI-lÀkemedelsupptÀckts Data-problem

HÀlso- och sjukvÄrd

Ginkgo Datapoints AvtÀcker VCPI: En DjÀrv Plan för att Fixa AI-lÀkemedelsupptÀckts Data-problem

mm

Under flera år har AI i läkemedelsupptäckt hämmats av ett bedrägligt enkelt problem: datan är inte tillräckligt bra. Berg av sekvensering, poolade perturbationsstudier och dessa blandade cellförsök gav intrycket av framsteg utan att leverera verkliga genombrott., men den prediktiva språng läkemedelsutvecklare förväntade sig har aldrig materialiserats. Istället för tydlighet producerade fältet brus. Istället för reproducerbarhet producerade det drift. Och istället för de precisa, farmakologiskt specifika mätningarna som krävs för att träna tillförlitliga virtuella cellmodeller, producerade det dataset som optimerats mer för skala än vetenskaplig integritet.

Detta är miljön in i vilken Ginkgo Datapoints lanserar Virtual Cell Pharmacology Initiative (VCPI)—ett projekt som inte bara lovar mer data utan syftar till att leverera bättre data, specialbyggd för AI-modeller som försöker förutsäga hur verkliga läkemedelsliknande molekyler stör verkliga biologiska system. Företagets officiella tillkännagivande understryker att VCPI kommer att generera över 12 miljarder datapunkter och profilera 100 000 föreningar, och etablera den första standardiserade farmakologidatamängden för virtuell cellmodellering.

Varför “Mer Data” Misslyckades

I blogginlägget som introducerar VCPI, använder Ginkgo en analogi som perfekt fångar fältets vilseledande bana. Tänk dig att kasta en handfull piller i en bur av möss—sedan försöka lista ut vilken mus som åt vad. Nu skala det till en miljon möss i en jättebur. Det är den grundläggande felaktigheten bakom poolade single-cell farmakologiska experiment. De genererar imponerande mängder data, men den underliggande designen förhindrar ren attribuering mellan förening och fenotyp.

Problemet är inte tekniken; det är experimentell arkitektur. Antagandet att större datamängder automatiskt lär bättre modeller har visat sig vara falskt. Bloggen kallar öppet denna mentalitet för en “data-beroende”, och hävdar att utan välstrukturerade, högsignalinmatningar, kommer även de mest avancerade AI-modellerna att lära sig felaktiga mönster.

VCPI representerar en skarp avvikelse från denna logik. Istället för att hylla storlek, dubblar det ner på biologisk spårbarhet, experimentell stränghet och den kontrollerade struktur som krävs för att AI faktiskt ska lära sig farmakologi.

Hur VCPI Återuppbygger Data-pipelinen

Istället för att förlita sig på poolade single-cell-assay, använder VCPI DRUG-seq, en höggenomströmnings bulk RNA-sekvenseringsmetod där varje förening behandlas i en isolerad barcoderad brunn. Detta tillåter Ginkgo att mäta behandlingsspecifika svar med mycket renare signal-till-brus-förhållande än poolade design erbjuder. Enligt pressmeddelandet, kan företagets automatiseringsinfrastruktur köra över 100 fulla 384-brunnsplattor per vecka, generera miljontals högtroget RNA-mätningar i industriell skala.

Lika viktigt är introduktionen av V-Ref293, en nyutvecklad, standardiserad referenscellinje. Istället för att varje laboratorium kör sin egen muterade, drifterade version av samma cellinje, skapar VCPI en universell biologisk baslinje—en “organisk tvilling” till den framväxande klassen av virtuella celler. Detta eliminerar en av de långvariga källorna till irreproducerbarhet i farmakogenomik och tillhandahåller den stabila sanning som AI-modeller desperat behöver.

Under denna initiativ, öppnar Ginkgo dörrarna till en community-driven datamängd med flera definierande komponenter:

  • Öppen deltagande för forskare, läkemedelsgrupper och AI-utvecklare
  • Kostnadsfri höggenomströmnings RNA-profilering för inskickade föreningar
  • Valfri embargo eller permanent proprietär åtkomst för bidragsgivare
  • Månatliga datautgåvor formade av community-röstning
  • Möjligheter för modell-delning, förening prioritering och tidig åtkomst “super-användar”-status

En Community-byggd Modell, Inte en Data-dump

En av de mest ovanliga aspekterna av VCPI är beslutet att lansera före datamängden existerar. Istället för att ladda upp en färdig resurs, ber Ginkgo den vetenskapliga gemenskapen att hjälpa till att bestämma vilka föreningar som är viktigast och att samarbeta i realtid medan datamängden växer.

Denna approach avriskerar också deltagande. Tidiga bioteknikföretag kan skicka in föreningar och få verklig farmakologisk data utan att förbruka dyrbart budget på höggenomströmnings screening. AI-lag kan säkerställa att datamängden återspeglar de perturbationer de faktiskt behöver för modellträning. Och akademiska laboratorier kan bidra medan de fortfarande behåller möjligheten till en 90-dagars exklusiv fönster.

Strukturen omvandlar data-generering till en deltagande vetenskaplig process—inte en statisk produkt.

Vad Detta Betyder för Framtiden för Bio-AI

De bredare implikationerna av VCPI sträcker sig bortom Ginkgo eller något enskilt virtuellt cell-initiativ. För virtuella cellmodeller att bli vetenskapligt trovärdiga, måste de tränas på data som är reproducerbara, behandlingsspecifika och förankrade till en stabil biologisk referens. Utan denna grund, kommer AI att fortsätta att hallucinera, mispredicera eller överanpassa till artefakter.

Initiativ som VCPI signalerar en förändring i hur fältet tänker om data själv. Experimentell design blir lika viktig som modellarkitektur. Reproducerbarhet återvänder som en central krav snarare än ett valfritt ideal. Och community-driven, öppen-infrastruktur-projekt börjar överträffa stängda proprietära datamängder i deras förmåga att accelerera innovation.

Om virtuella celler till slut blir tillförlitliga prediktiva motorer—verktyg som hjälper till att rangordna föreningar, flagga toxiciteter eller belysa vägar innan en människa någonsin rör en pipett—kommer det att vara för att projekt som VCPI skapade den strukturerade, trovärdiga data-miljön de behövde för att växa.

Genom att prioritera bättre data över enbart mer data, omdefinierar Ginkgo grunderna för AI-aktiverad biologi. VCPI reagerar inte bara på data-krisen i läkemedelsupptäckt; det sätter scenen för en ny era där biologiska experiment och AI-träningspipelines utvecklas tillsammans, öppet och med syfte.

Antoine Àr en visionÀr ledare och medgrundare av Unite.AI, driven av en outtröttlig passion för att forma och frÀmja framtiden för AI och robotik. En serieentreprenör, han tror att AI kommer att vara lika omstörtande för samhÀllet som elektricitet, och fÄngas ofta i extas över potentialen för omstörtande teknologier och AGI. Som en futurist, Àr han dedikerad till att utforska hur dessa innovationer kommer att forma vÄr vÀrld. Dessutom Àr han grundare av Securities.io, en plattform som fokuserar pÄ att investera i banbrytande teknologier som omdefinierar framtiden och omformar hela sektorer.