Finanziamenti
Protege raccoglie 30 milioni di dollari in una estensione di serie A guidata da Andreessen Horowitz per espandere l’accesso ai dati del mondo reale per l’AI

Protege, una piattaforma di dati AI focalizzata sull’apertura di set di dati del mondo reale attendibili per lo sviluppo dell’AI, ha raccolto 30 milioni di dollari in un’estensione di serie A guidata da Andreessen Horowitz. La nuova finanza estende il finanziamento di 25 milioni di dollari di serie A annunciato ad agosto 2025 e porta il finanziamento totale a 65 milioni di dollari dalla sua fondazione nel 2024.
Gli investitori che ritornano includono Footwork, CRV, Bloomberg Beta, Flex Capital e Shaper Capital, riflettendo una crescente fiducia degli investitori nell’approccio di Protege a una delle sfide più persistenti nell’intelligenza artificiale: l’accesso ai dati di alta qualità, non pubblici.
Superare le limitazioni dei dati dell’AI in crescita
Man mano che i modelli di AI avanzano, il fattore limitante è sempre più spesso non il calcolo o gli algoritmi, ma i dati. I set di dati pubblici stanno diventando saturi, mentre molte delle fonti di informazione più preziose – come le cartelle cliniche, gli archivi dei media, i dati audio e la cattura del movimento – rimangono frammentati, proprietari o difficili da accedere in modo responsabile.
Protege si trova all’incrocio tra i detentori di dati e gli sviluppatori di AI, consentendo l’accesso ai set di dati del mondo reale tramite licenza, garantendo che siano strutturati, curati e ottimizzati per i flussi di lavoro dell’AI moderna. La domanda di questo tipo di dati sta aumentando rapidamente in tutti i settori, in particolare man mano che i sistemi di AI si spostano dall’esperimentazione agli ambienti di produzione.
Un modello di licenza per i dati del mondo reale
Invece di affidarsi allo scraping o all’aggregazione non strutturata, Protege lavora direttamente con i fornitori di dati attendibili attraverso accordi di licenza. Questi partner contribuiscono con set di dati privati e proprietari che possono includere registri sanitari deidentificati, immagini mediche, registrazioni audio e contenuti multimediali.
Protege applica la propria competenza tecnica per pulire, curare e confezionare questi dati in modo che possano essere utilizzati efficacemente per la formazione e la valutazione. I fornitori di dati partecipano attraverso accordi di ripartizione dei ricavi legati all’utilizzo, creando un modello ripetibile che allinea gli incentivi intorno all’accesso responsabile ai dati e al loro riutilizzo.
La società lavora con organizzazioni e istituzioni di AI in tutto il mondo, tra cui molte delle più grandi società tecnologiche del mondo, supportando lo sviluppo di sistemi di AI di prossima generazione in molti domini.
Dirigenza esperta e sostegno strategico
Protege è guidata dal CEO e co-fondatore Bobby Samuels, con Travis May – precedentemente CEO di Datavant e LiveRamp – che serve come presidente e co-fondatore. Il team di leadership porta una profonda esperienza nella navigazione di settori intensivi in dati dove la privacy, la conformità e la scala sono critiche. In un intervista recente con Unite.AI, Samuels ha discusso come la sua esperienza nel governo dei dati e nella privacy abbia plasmato la sua visione per una piattaforma che collega i detentori di dati e gli sviluppatori di AI in modo trasparente ed etico, sottolineando l’importanza crescente dell’accesso ai dati governati nell’ecosistema dell’AI più ampio. –
Dal punto di vista degli investitori, Andreessen Horowitz considera l’accesso ai dati proprietari e del mondo reale come un vantaggio determinante nella prossima fase dell’AI. Man mano che le architetture dei modelli diventano più standardizzate, i dati differenziati – con una chiara provenienza e licenza etica – stanno emergendo come un driver chiave delle prestazioni e della difensibilità competitiva.
Come Protege intende utilizzare il nuovo capitale
L’estensione di serie A supporterà lo sviluppo del prodotto, la crescita della rete di partner di dati di Protege in nuovi domini e formati e una collaborazione più profonda con le istituzioni che detengono dati del mondo reale di valore. La società intende anche scalare la propria infrastruttura e team per soddisfare la crescente domanda dei gruppi di ricerca e sviluppo dell’AI.
Questo focus riflette un più ampio cambiamento di settore, dove i progressi dell’AI sono sempre più legati alla qualità, alla provenienza e alla rilevanza dei dati piuttosto che alle sole dimensioni del modello.
Implicazioni per il futuro dell’AI
Protege’s slancio indica un cambiamento strutturale nel modo in cui vengono costruiti i sistemi di AI. Man mano che le fonti di dati facilmente accessibili si esauriscono, i futuri progressi saranno probabilmente il risultato di un’apertura responsabile dei dati privati e del mondo reale generati attraverso l’attività quotidiana.
Piattaforme come Protege suggeriscono un futuro in cui l’accesso ai dati è governato, compensato e trasparente. Per gli sviluppatori di AI, ciò potrebbe significare modelli più affidabili e specifici del dominio. Per i detentori di dati, crea un percorso sostenibile per partecipare allo sviluppo dell’AI senza rinunciare al controllo.
Nel tempo, questo approccio potrebbe influenzare il modo in cui l’industria – e i regolatori – pensano alla proprietà dei dati, al riutilizzo e alla creazione di valore. Invece di trattare i dati come qualcosa da estrarre, lo sviluppo dell’AI potrebbe dipendere sempre più da reti basate sulla fiducia che bilanciano l’innovazione con la responsabilità.












