Entretiens

Ittai Dayan, MD, Co-fondateur & PDG de Rhino Health – SĂ©rie d’entretiens

mm

Ittai Dayan, MD est le co-fondateur et PDG de Rhino Health. Son expérience est dans le développement de l’intelligence artificielle et des diagnostics, ainsi que dans la médecine clinique et la recherche. Il est un ancien membre clé de la pratique de santé de BCG et un dirigeant hospitalier. Il se concentre actuellement sur la contribution au développement d’une intelligence artificielle sûre, équitable et efficace dans le secteur des soins de santé et des sciences de la vie. Chez Rhino Health, ils utilisent le calcul distribué et l’apprentissage fédéré comme moyen de maintenir la confidentialité des patients et de favoriser la collaboration à travers le paysage fragmenté des soins de santé.

Il a servi dans les forces spéciales de l’IDF, a dirigé le plus grand centre de traduction AI basé sur un centre médical universitaire au monde. Il est un expert en développement et commercialisation d’IA, et un coureur de longue distance.

Pouvez-vous partager l’histoire de la genèse de Rhino Health ?

Mon parcours dans l’IA a commencé lorsque j’étais clinicien et chercheur, en utilisant une forme précoce de « biomarqueur numérique » pour mesurer la réponse au traitement des troubles mentaux. Plus tard, j’ai dirigé le Center for Clinical Data Science (CCDS) à Mass General Brigham. Là, j’ai supervisé le développement de dizaines d’applications d’IA cliniques, et j’ai constaté de visu les défis sous-jacents liés à l’accès et à l’« activation » des données nécessaires pour développer et former des produits d’IA de qualité réglementaire.

Malgré les nombreux progrès réalisés dans le domaine de l’IA dans les soins de santé, la route de la conception à la mise sur le marché d’un produit est longue et souvent cahoteuse. Les solutions échouent (ou déçoivent simplement) une fois déployées cliniquement, et le soutien de l’ensemble du cycle de vie de l’IA est quasi impossible sans un accès continu à une large gamme de données cliniques. Le défi est passé de la création de modèles à leur maintenance. Pour répondre à ce défi, j’ai convaincu le système Mass General Brigham de la valeur de disposer de leur propre « CRO spécialisé pour l’IA » (CRO = Organisation de recherche clinique), pour tester les algorithmes de plusieurs développeurs commerciaux.

Cependant, le problème persiste – les données de santé sont toujours très compartimentalisées, et même une grande quantité de données provenant d’un seul réseau ne suffisent pas pour lutter contre les cibles de plus en plus étroites de l’IA médicale. À l’été 2020, j’ai initié et dirigé (avec le Dr Mona Flores de NVIDIA), la plus grande étude de apprentissage fédéré dans le domaine de la santé à cette époque, EXAM. Nous avons utilisé l’apprentissage fédéré pour créer un modèle prédictif de résultats COVID, en exploitant des données provenant du monde entier, sans partager aucune donnée.. Publiée par la suite dans Nature Medicine, cette étude a démontré l’impact positif de l’exploitation de jeux de données divers et disparates et a souligné le potentiel d’une utilisation plus large de l’apprentissage fédéré dans le domaine de la santé.

Cette expérience, cependant, a mis en évidence un certain nombre de défis. Ceux-ci comprenaient l’orchestration des données à travers les sites collaborateurs, l’assurance de la traçabilité des données et de leur caractérisation appropriée, ainsi que la charge pesant sur les départements IT de chaque établissement, qui devaient apprendre des technologies de pointe qu’ils n’avaient pas l’habitude d’utiliser. Cela a nécessité une nouvelle plate-forme qui prendrait en charge ces nouvelles « collaborations de données distribuées ». J’ai décidé de faire équipe avec mon co-fondateur, Yuval Baror, pour créer une plate-forme de bout en bout pour soutenir ces collaborations. Cette plate-forme est la « plate-forme Rhino Health », qui utilise l’apprentissage fédéré et le calcul de pointe.

Pourquoi pensez-vous que les modèles d’IA échouent souvent à livrer les résultats attendus dans un contexte de soins de santé ?

L’IA médicale est souvent formée sur de petits ensembles de données étroits, tels que des ensembles de données provenant d’un seul établissement ou d’une région géographique, ce qui entraîne le fait que le modèle ne fonctionne bien que sur les types de données qu’il a vus. Une fois que l’algorithme est appliqué à des patients ou à des scénarios qui diffèrent de l’ensemble de données d’entraînement étroit, les performances sont gravement affectées.

Andrew Ng, a bien capturé cette notion en déclarant : « Il s’avère que lorsque nous collectons des données de l’hôpital Stanford… nous pouvons publier des articles montrant [les algorithmes] sont comparables aux radiologues humains pour détecter certaines conditions. … [Lorsque] vous prenez le même modèle, le même système d’IA, à un hôpital plus ancien en bas de la rue, avec une machine plus ancienne, et que le technicien utilise un protocole d’imagerie légèrement différent, ce dérive des données entraîne une dégradation significative des performances du système d’IA »3.

Simplement dit, la plupart des modèles d’IA ne sont pas formés sur des données suffisamment diverses et de haute qualité, ce qui entraîne de mauvaises performances dans le « monde réel ». Ce problème a été bien documenté à la fois dans les cercles scientifiques et grand public, tels que dans Science et Politico.

Combien est-il important de tester sur des groupes de patients divers ?

Tester sur des groupes de patients divers est crucial pour garantir que le produit d’IA résultant est non seulement efficace et performant, mais également sûr. Les algorithmes qui ne sont pas formés ou testés sur des groupes de patients suffisamment divers peuvent souffrir de biais algorithmiques, un problème grave dans les soins de santé et les technologies de santé. Non seulement de tels algorithmes reflèteront-ils les biais présents dans les données d’entraînement, mais ils exacerberont également ces biais et amplifieront les inégalités raciales, ethniques, religieuses, de genre, etc. existantes dans les soins de santé. Le fait de ne pas tester sur des groupes de patients divers peut entraîner des produits dangereux.

Une étude récemment publiée5, utilisant la plate-forme Rhino Health, a examiné les performances d’un algorithme d’IA détectant les anévrismes cérébraux développé sur un site sur quatre sites différents avec différents types de scanners. Les résultats ont montré une variabilité de performance substantielle sur les sites avec différents types de scanners, soulignant l’importance de la formation et du test sur des ensembles de données divers.

Comment identifiez-vous si une sous-population n’est pas représentée ?

Une approche courante consiste à analyser les distributions de variables dans différents ensembles de données, individuellement et combinés. Cela peut informer les développeurs à la fois lors de la préparation des ensembles de données « d’entraînement » et de validation. La plate-forme Rhino Health permet de le faire, et en outre, les utilisateurs peuvent voir comment le modèle se comporte sur diverses cohortes pour assurer la généralisabilité et les performances durables sur les sous-populations.

Pouvez-vous décrire ce qu’est l’apprentissage fédéré et comment il résout certains de ces problèmes ?

L’apprentissage fédéré (FL) peut être défini de manière générale comme le processus dans lequel les modèles d’IA sont formés et continuent à s’améliorer avec le temps, en utilisant des données disparates, sans avoir besoin de partager ou de centraliser les données. C’est un énorme progrès dans le développement de l’IA. Historiquement, tout utilisateur souhaitant collaborer avec plusieurs sites doit regrouper ces données, induisant une myriade de contraintes, de coûts et de procédures de conformité onéreuses et fastidieuses.

Aujourd’hui, avec des logiciels tels que la plate-forme Rhino Health, l’apprentissage fédéré devient une réalité quotidienne dans les soins de santé et les sciences de la vie. L’apprentissage fédéré permet aux utilisateurs d’explorer, de curer et de valider les données tout en gardant ces données sur les serveurs locaux de leurs collaborateurs. Le code conteneurisé, tel qu’un algorithme d’IA/ML ou une application analytique, est envoyé au serveur local où l’exécution de ce code, telle que la formation ou la validation d’un algorithme d’IA/ML, est effectuée « localement ». Les données restent ainsi avec le « gardien de données » à tout moment.

Les hôpitaux, en particulier, sont préoccupés par les risques associés à l’agrégation de données de patients sensibles. Cela a déjà conduit à des situations embarrassantes, où il est devenu clair que les organisations de soins de santé ont collaboré avec l’industrie sans exactement comprendre l’utilisation de leurs données. À leur tour, ils limitent la quantité de collaboration que les chercheurs industriels et universitaires peuvent effectuer, ralentissant la R & D et impactant la qualité des produits dans l’ensemble du secteur des soins de santé. L’apprentissage fédéré peut atténuer cela et permettre des collaborations de données comme jamais auparavant, tout en contrôlant les risques associés à ces collaborations.

Pouvez-vous partager la vision de Rhino Health pour permettre la création rapide de modèles en utilisant des données plus diverses ?

Nous nous représentons un écosystème de développeurs et d’utilisateurs d’IA, collaborant sans crainte ni contrainte, tout en respectant les limites des réglementations.. Les collaborateurs sont en mesure d’identifier rapidement les données de formation et de test nécessaires à partir de diverses géographies, d’accéder et d’interagir avec ces données, et d’itérer sur le développement de modèles afin de garantir une généralisabilité, des performances et une sécurité suffisantes.

Au cœur de cela se trouve la plate-forme Rhino Health, qui offre un « guichet unique » pour les développeurs d’IA afin de construire des ensembles de données massifs et divers, de former et de valider des algorithmes d’IA, et de surveiller et de maintenir en permanence les produits d’IA déployés.

Comment la plate-forme Rhino Health empêche-t-elle les biais d’IA et offre-t-elle une explication d’IA ?

En débloquant et en rationalisant les collaborations de données, les développeurs d’IA peuvent exploiter des ensembles de données plus grands et plus divers pour la formation et le test de leurs applications. Le résultat de ces ensembles de données plus robustes est un produit plus généralisable qui n’est pas alourdi par les biais d’un seul établissement ou d’un ensemble de données étroit. Pour soutenir l’explication d’IA, notre plate-forme fournit une vue claire sur les données utilisées tout au long du processus de développement, avec la possibilité d’analyser les origines des données, les distributions des valeurs et d’autres métriques clés pour garantir une diversité et une qualité de données adéquates. En outre, notre plate-forme permet une fonctionnalité qui n’est pas possible si les données sont simplement regroupées, y compris la possibilité pour les utilisateurs d’améliorer davantage leurs ensembles de données avec des variables supplémentaires, telles que celles calculées à partir de points de données existants, afin d’examiner l’inférence causale et d’atténuer les facteurs de confusion.

Comment répondez-vous aux médecins qui craignent que la dépendance excessive à l’égard de l’IA puisse conduire à des résultats biaisés qui ne sont pas validés de manière indépendante ?

Nous comprenons cette préoccupation et reconnaissons qu’un certain nombre d’applications sur le marché aujourd’hui peuvent en effet être biaisées. Notre réponse est que nous devons nous réunir en tant qu’industrie, en tant que communauté de soins de santé d’abord et avant tout préoccupée par la sécurité des patients, afin de définir des politiques et des procédures pour prévenir de tels biais et garantir des applications d’IA sûres et efficaces. Les développeurs d’IA ont la responsabilité de garantir que leurs produits d’IA commercialisés sont validés de manière indépendante afin de gagner la confiance des professionnels de la santé et des patients. Rhino Health est dédié à soutenir des produits d’IA sûrs et fiables et travaille avec des partenaires pour permettre et rationaliser la validation indépendante des applications d’IA avant leur déploiement dans les contextes cliniques en débloquant les barrières aux données de validation nécessaires.

Quelle est votre vision pour l’avenir de l’IA dans les soins de santé ?

La vision de Rhino Health est celle d’un monde où l’IA a atteint son plein potentiel dans les soins de santé. Nous travaillons diligemment pour créer de la transparence et favoriser la collaboration en affirmant la confidentialité afin de permettre ce monde. Nous nous représentons un système de soins de santé dans lequel l’IA n’est pas limitée par les pare-feu, les géographies ou les restrictions réglementaires. Les développeurs d’IA auront un accès contrôlé à toutes les données dont ils ont besoin pour construire des modèles puissants et généralisables – et pour les surveiller et les améliorer en permanence avec un flux de données en temps réel. Les fournisseurs et les patients auront la confiance de savoir qu’ils ne perdent pas le contrôle de leurs données et peuvent garantir qu’elles sont utilisées à bon escient. Les régulateurs seront en mesure de surveiller l’efficacité des modèles utilisés dans le développement de produits pharmaceutiques et d’appareils en temps réel. Les organisations de santé publique bénéficieront de ces progrès de l’IA, tandis que les patients et les fournisseurs dormiront sur leurs deux oreilles, sachant que la confidentialité est protégée.

Je vous remercie pour cette grande interview, les lecteurs qui souhaitent en savoir plus devraient visiter Rhino Health.

Antoine est un leader visionnaire et partenaire fondateur de Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Un entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et se fait souvent prendre en train de vanter le potentiel des technologies perturbatrices et de l'AGI.
En tant que futurist, il se consacre à explorer comment ces innovations vont façonner notre monde. En outre, il est le fondateur de Securities.io, une plateforme axée sur l'investissement dans les technologies de pointe qui redéfinissent l'avenir et remodelent des secteurs entiers.