Interviste
Josh Miller, CEO di Gradient Health – Serie di Interviste

Josh Miller è il CEO di Gradient Health, un’azienda fondata sull’idea che la diagnostica automatizzata debba esistere per rendere la sanità equa e accessibile a tutti. Gradient Health mira ad accelerare la diagnostica automatizzata con l’intelligenza artificiale con dati organizzati, etichettati e disponibili.
Potresti condividere la storia di come è nata Gradient Health?
Il mio cofondatore Ouwen e io avevamo appena lasciato la nostra prima startup, FarmShots, che utilizzava la visione computerizzata per aiutare a ridurre la quantità di pesticidi utilizzati in agricoltura, e stavamo cercando la nostra prossima sfida.
Siamo sempre stati motivati dal desiderio di trovare un problema difficile da risolvere con la tecnologia che a) abbia l’opportunità di fare molto bene nel mondo e b) porti a un solido business. Ouwen stava lavorando alla sua laurea in medicina e, con la nostra esperienza nella visione computerizzata, l’imaging medico era una scelta naturale per noi. A causa dell’impatto devastante del cancro al seno, abbiamo scelto la mammografia come possibile prima applicazione. Quindi abbiamo detto: “Ok, dove iniziamo? Abbiamo bisogno di dati. Abbiamo bisogno di mille mammografie. Dove si può ottenere una tale quantità di dati?” e la risposta era “Da nessuna parte”. Ci siamo resi conto immediatamente che è molto difficile trovare dati. Dopo mesi, questa frustrazione è cresciuta in un problema filosofico per noi, abbiamo pensato: “chiunque che cerchi di fare del bene in questo settore non dovrebbe dover lottare e faticare per ottenere i dati di cui ha bisogno per costruire algoritmi salvavita”. E così abbiamo detto: “Ehi, forse questo è proprio il nostro problema da risolvere”.
Quali sono i rischi attuali nel mercato con dati non rappresentativi?
Da numerosi studi e esempi del mondo reale, sappiamo che se costruiamo un algoritmo utilizzando solo dati della costa occidentale e lo portiamo nel sud-est, non funzionerà. Ripetutamente sentiamo storie di intelligenza artificiale che funziona bene nell’ospedale del nord-est in cui è stato creato e poi, quando lo si distribuisce altrove, la precisione scende al di sotto del 50%.
Credo che lo scopo fondamentale dell’intelligenza artificiale, a livello etico, sia che debba ridurre le disparità sanitarie. L’obiettivo è rendere le cure di qualità accessibili e abbordabili per tutti. Ma il problema è che quando lo si costruisce su dati scadenti, si aumentano le disparità. Stiamo fallendo nella missione dell’intelligenza artificiale sanitaria se la lasciamo funzionare solo per i bianchi della costa. Le persone provenienti da ambienti sottorappresentati soffriranno effettivamente di più discriminazioni, non meno.
Potresti discutere come Gradient Health ottiene i dati?
Certo, ci associamo con tutti i tipi di sistemi sanitari in tutto il mondo il cui dati sono altrimenti archiviati, costando loro denaro e non beneficiando nessuno. De-identifichiamo completamente i loro dati alla fonte e poi li organizziamo con cura per i ricercatori.
Come Gradient Health assicura che i dati siano imparziali e il più possibile diversificati?
Ci sono molti modi. Ad esempio, quando raccogliamo dati, ci assicuriamo di includere molti ambulatori comunitari, dove spesso si hanno dati più rappresentativi, oltre agli ospedali più grandi. Otteniamo anche i nostri dati da un gran numero di siti clinici. Cerchiamo di ottenere il maggior numero possibile di siti da una vasta gamma di popolazioni. Quindi non solo avere un alto numero di siti, ma averli geograficamente e socio-economicamente diversificati. Perché se tutti i tuoi siti sono solo degli ospedali del centro città, non è ancora un dato rappresentativo, vero?
Per validare tutto ciò, eseguiamo statistiche su tutti questi set di dati e li personalizziamo per il cliente, per assicurarci che stiano ottenendo dati diversificati in termini di tecnologia e demografia.
Perché questo livello di controllo dei dati è così importante per progettare algoritmi di intelligenza artificiale robusti?
Ci sono molte variabili che un’intelligenza artificiale potrebbe incontrare nel mondo reale e il nostro obiettivo è assicurarci che l’algoritmo sia il più robusto possibile. Per semplificare le cose, pensiamo a cinque variabili chiave nei nostri dati. La prima variabile a cui pensiamo è il “fabbricante di attrezzature”. È ovvio, ma se costruiamo un algoritmo utilizzando solo dati di scanner della GE, non funzionerà altrettanto bene su un Hitachi, ad esempio.
In linea con questo è la variabile “modello di attrezzatura”. Questa è in realtà piuttosto interessante dal punto di vista della disuguaglianza sanitaria. Sappiamo che gli ospedali di ricerca grandi e ben finanziati tendono ad avere le versioni più recenti e migliori degli scanner. E se addestrano la loro intelligenza artificiale solo con i loro modelli del 2022, non funzionerà altrettanto bene su un modello più vecchio del 2010. Questi sistemi più vecchi sono esattamente quelli trovati nelle aree meno abbienti e rurali. Quindi, utilizzando solo dati dai modelli più recenti, stanno involontariamente introducendo ulteriore pregiudizio contro le persone di queste comunità.
Le altre variabili chiave sono il genere, l’etnia e l’età e ci impegniamo molto per assicurarci che i nostri dati siano proporzionalmente equilibrati su tutti loro.
Quali sono alcuni degli ostacoli normativi che le aziende MedTech affrontano?
Stiamo iniziando a vedere che la FDA indaga realmente sul pregiudizio nei set di dati. Abbiamo avuto ricercatori che sono venuti da noi e hanno detto: “la FDA ha rifiutato il nostro algoritmo perché mancava di una popolazione afroamericana del 15%” (la percentuale approssimativa di afroamericani che fanno parte della popolazione statunitense). Abbiamo anche sentito di uno sviluppatore a cui è stato detto che doveva includere l’1% di isolani del Pacifico hawaiani nei suoi dati di addestramento.
Quindi, la FDA sta iniziando a rendersi conto che questi algoritmi, che sono stati addestrati solo in un singolo ospedale, non funzionano nel mondo reale. Il fatto è che se si vuole ottenere il marchio CE e l’approvazione della FDA, si deve arrivare con un set di dati che rappresenti la popolazione. È, giustamente, non più accettabile addestrare un’intelligenza artificiale su un gruppo piccolo o non rappresentativo.
Il rischio per le aziende MedTech è che investono milioni di dollari per portare la loro tecnologia a un punto in cui pensano di essere pronti per l’approvazione normativa e poi, se non riescono a ottenerla, non otterranno mai il rimborso o i ricavi. In definitiva, il percorso verso la commercializzazione e il percorso per avere il tipo di impatto benefico sulla sanità che desiderano avere richiede loro di curarsi del pregiudizio dei dati.
Quali sono alcune delle opzioni per superare questi ostacoli dal punto di vista dei dati?
Negli ultimi anni, i metodi di gestione dei dati sono evoluti e gli sviluppatori di intelligenza artificiale hanno ora più opzioni a disposizione che mai. Dalle società di intermediari di dati e partner all’apprendimento federato e ai dati sintetici, ci sono nuovi approcci a questi ostacoli. Qualsiasi metodo scelgano, li incoraggiamo sempre a considerare se i loro dati sono veramente rappresentativi della popolazione che utilizzerà il prodotto. Questo è di gran lunga l’aspetto più difficile dell’ottenere i dati.
Una soluzione che Gradient Health offre è Gradient Label, cosa è questa soluzione e come consente di etichettare i dati su larga scala?
L’intelligenza artificiale per l’imaging medico non richiede solo dati, ma anche annotazioni di esperti. E aiutiamo le aziende a ottenere queste annotazioni di esperti, comprese quelle dei radiologi.
Qual è la tua visione per il futuro dell’intelligenza artificiale e dei dati nella sanità?
Ci sono già migliaia di strumenti di intelligenza artificiale là fuori che esaminano tutto, dalle punte delle dita alle punte dei piedi, e credo che questo continuerà. Credo che ci saranno almeno 10 algoritmi per ogni condizione in un libro di testo medico. Ognuno avrà più strumenti competitivi per aiutare i clinici a fornire le migliori cure.
Non credo che probabilmente finiremo per vedere uno stile di Tricorder come in Star Trek che scansiona qualcuno e affronta ogni possibile problema dalla testa ai piedi. Invece, avremo applicazioni specializzate per ogni subset.
C’è qualcos’altro che ti piacerebbe condividere su Gradient Health?
Sono entusiasta del futuro. Credo che stiamo andando verso un posto in cui la sanità è economica, equa e accessibile a tutti e sono ansioso che Gradient abbia l’opportunità di svolgere un ruolo fondamentale nel farlo accadere. L’intero team qui crede sinceramente in questa missione e c’è una passione unita che non si trova in ogni azienda. E mi piace!
Grazie per la grande intervista, i lettori che desiderano saperne di più possono visitare Gradient Health.












