Connect with us

Interviews

Etienne Bernard, Co-Fondateur & PDG de NuMind – Série d’entretiens

mm

Etienne Bernard, est le Co-Fondateur & PDG de NuMind une entreprise de logiciels fondée en juin 2022 spécialisée dans le développement d’outils d’apprentissage automatique. Etienne est un expert en IA & apprentissage automatique. Après un doctorat (ENS) & un postdoctorat (MIT) en physique statistique, Etienne a rejoint Wolfram Research où il est devenu le responsable de l’apprentissage automatique pendant 7 ans. Pendant cette période, Etienne a dirigé le développement d’outils d’apprentissage automatique, d’un framework d’apprentissage profond convivial, et de diverses applications d’apprentissage automatique.

Qu’est-ce qui vous a initialement attiré vers l’apprentissage automatique ?

La première fois que j’ai entendu le terme « apprentissage automatique » était en 2009, je crois, grâce au prix Netflix. J’ai trouvé l’idée que les machines puissent apprendre fascinante et puissante. Il était déjà clair pour moi que cela mènerait à de nombreuses applications importantes – y compris la possibilité excitante de créer des IA. J’ai immédiatement décidé de plonger dedans, et je n’en suis jamais revenu.

Après avoir obtenu un doctorat (ENS) & un postdoctorat (MIT) en physique statistique, vous avez rejoint Wolfram Research où vous êtes devenu le responsable de l’apprentissage automatique pendant 7 ans. Quels étaient certains des projets les plus intéressants sur lesquels vous avez travaillé ?

Mes projets préférés chez Wolfram étaient le développement de fonctions d’apprentissage automatique automatiques pour le langage Wolfram (a.k.a. Mathematica). Le premier était Classify, où vous lui donnez simplement les données et il retourne un classificateur. Pour moi, l’apprentissage automatique a toujours été une question d’automatisation. Vous n’ajustez pas les hyperparamètres de votre étudiant humain, et vous ne devriez pas le faire pour votre machine non plus ! C’était assez difficile d’un point de vue scientifique et d’ingénierie logicielle pour créer des fonctions d’apprentissage automatique vraiment robustes et efficaces.

La création d’un framework de réseau de neurones de haut niveau était également un projet très intéressant. Beaucoup de décisions de conception difficiles sur la façon de représenter les réseaux de neurones de manière symbolique, de les visualiser et de les manipuler (c’est-à-dire être capable de couper certaines pièces, de coller d’autres ensemble, de remplacer des couches, etc.) Je pense que nous avons fait un travail décent, et si c’était open source, je suis sûr qu’il serait très utilisé ;

Pendant cette période, vous avez également écrit un livre fondateur intitulé « Introduction to Machine Learning », quels étaient certains des défis derrière l’écriture d’un livre aussi complet ?

Oh, il y en avait beaucoup ! Cela a pris deux ans au total pour écrire. J’aurais pu décider d’écrire simplement un livre « comment faire », ce qui aurait été plus facile, mais une partie de mon parcours chez Wolfram a été d’apprendre l’apprentissage automatique, et je me sentais le besoin de transmettre cela. Donc la principale difficulté était de déterminer de quoi parler exactement, et dans quel ordre, pour le rendre intéressant et facile à comprendre. Ensuite, il y avait les détails pédagogiques : devais-je utiliser une formule mathématique pour ce concept ? Ou du code ? Ou simplement une visualisation ? Je voulais rendre ce livre aussi accessible que possible et cela m’a donné beaucoup de maux de tête. Dans l’ensemble, je suis heureux du résultat. J’espère qu’il sera utile à beaucoup !

Pouvez-vous partager l’histoire de la genèse de NuMind ?

D’accord. Je voulais créer une startup depuis un certain temps, à l’origine en 2012 pour créer un outil d’apprentissage automatique, mais le travail chez Wolfram était trop amusant. Ensuite, vers 2019-2020, les premiers grands modèles de langage (LLM) ont commencé à apparaître, comme GPT-2 et puis GPT-3. C’était un choc pour moi de voir à quel point ils pouvaient comprendre et générer du texte. En même temps, je pouvais voir à quel point il était douloureux de créer des modèles de traitement automatique du langage : vous deviez faire face à une équipe d’annotation, avoir des experts qui exécutaient de nombreuses expériences, etc. J’ai pensé qu’il devait y avoir un moyen d’utiliser ces LLM via un outil pour améliorer considérablement l’expérience de création de modèles de traitement automatique du langage. Mon co-fondateur, Samuel (qui se trouve être mon cousin), partageait la même vision, et nous avons donc décidé de créer cet outil.

L’objectif de NuMind est de diffuser l’utilisation de l’apprentissage automatique – et de l’intelligence artificielle en général – en créant des outils simples mais puissants. Quels sont certains des outils qui sont actuellement disponibles ?

En effet. Notre premier outil est pour la création de modèles de traitement automatique du langage personnalisés. Par exemple, disons que vous voulez analyser le sentiment de vos utilisateurs à partir de leurs commentaires. Utiliser un modèle standard n’est généralement pas très bon, car il a été formé sur un type de données différent, et pour une tâche légèrement différente (les tâches d’analyse de sentiment sont étonnamment différentes les unes des autres !). Au lieu de cela, vous voulez former un modèle personnalisé qui fonctionne bien sur vos données. Notre outil permet de le faire de manière extrêmement simple et efficace. Vous chargez vos données, effectuez une petite quantité d’annotation, et obtenez un modèle que vous pouvez déployer via une API. Cela est possible grâce à l’utilisation des LLM, mais également à ce nouveau paradigme d’apprentissage que nous appelons le développement d’IA interactif.

Quels sont certains des modèles personnalisés que vous voyez développés à partir du premier tour de clients de NuMind ?

Il y a eu quelques analyseurs de sentiment. Par exemple, un client surveille le sentiment des discussions de groupe où les gens s’aident mutuellement à lutter contre leurs addictions. Cette analyse est nécessaire pour intervenir dans les rares cas où le sentiment est en déclin. Un autre client nous utilise pour trouver quels postes de travail sont les meilleurs pour un CV donné – et à propos, je pense qu’il y a beaucoup de potentiel dans ces types de IA de mise en correspondance. Nous avons également des clients qui extraient des informations de documents médicaux et juridiques.

Quels sont les gains de temps que les entreprises peuvent voir en utilisant les outils de NuMind ?

Cela dépend bien sûr de l’application, mais par rapport aux solutions traditionnelles (étiquetage des données et formation d’un modèle séparément), nous voyons jusqu’à 10 fois d’amélioration de la vitesse pour obtenir un modèle et le mettre en production. Je m’attends à ce que ce chiffre s’améliore à mesure que nous continuons à développer le produit. Finalement, je pense que les projets qui auraient pris des mois seront terminés en quelques jours, et avec de meilleures performances.

Pouvez-vous expliquer comment fonctionne le développement d’IA interactif de NuMind ?

L’idée du développement d’IA interactif vient de la façon dont les humains s’enseignent les uns les autres. Par exemple, disons que vous embauchez un stagiaire pour classer vos e-mails. Vous décririez d’abord la tâche et son objectif. Ensuite, vous pourriez donner quelques bons exemples, des cas de bord peut-être. Ensuite, votre stagiaire commencerait à étiqueter les e-mails, et une conversation commencerait. Votre stagiaire reviendrait avec des questions telles que « Comment devrais-je étiqueter celui-ci ? » ou « Je pense que nous devrions créer un nouveau libellé pour celui-ci », ou même en vous demandant « pourquoi » nous devrions étiqueter d’une certaine manière. De même, vous pourriez poser des questions à votre stagiaire pour identifier et corriger les lacunes dans ses connaissances. Cette façon d’enseigner est très naturelle et extrêmement efficace en termes d’échange d’informations. Nous essayons de reproduire ce flux de travail pour que les humains puissent enseigner efficacement aux machines.

D’un point de vue technique, ce flux de travail est une communication à faible latence, à large bande passante, multimodale et bidirectionnelle entre l’humain et la machine, et nous avons décidé de l’appeler le développement d’IA interactif pour souligner les aspects de bidirectionnalité et de faible latence. Je vois cela comme un troisième paradigme pour enseigner aux machines, après la programmation classique et l’apprentissage automatique classique (où vous donnez simplement un ensemble d’exemples de la tâche pour que l’ordinateur découvre ce qu’il doit faire).

Ce nouveau paradigme est débloqué par les LLM. En effet, vous avez besoin d’avoir quelque chose qui est déjà un peu intelligent dans la machine pour interagir efficacement avec elle. Je pense que ce paradigme deviendra courant dans un avenir proche, et nous pouvons déjà en voir des bribes avec les LLM basés sur le chat, et avec notre outil bien sûr.

Nous appliquons ce paradigme pour enseigner des tâches de traitement automatique du langage, mais cela peut – et sera – utilisé pour bien plus, y compris le développement de logiciels.

Y a-t-il autre chose que vous aimeriez partager sur NuMind ?

Peut-être que c’est un outil qui peut être utilisé à la fois par des experts et des non-experts en apprentissage automatique, qu’il est multilingue, que vous possédez vos modèles, et que les données peuvent rester sur votre machine !

Sinon, nous sommes en phase de bêta privée, donc si vous avez des besoins de traitement automatique du langage, nous serions ravis de discuter et de déterminer si/nous pouvons vous aider !

Merci pour cette grande interview, les lecteurs qui souhaitent en savoir plus doivent visiter NuMind.

Antoine est un leader visionnaire et partenaire fondateur de Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Un entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et se fait souvent prendre en train de vanter le potentiel des technologies perturbatrices et de l'AGI.
En tant que futurist, il se consacre à explorer comment ces innovations vont façonner notre monde. En outre, il est le fondateur de Securities.io, une plateforme axée sur l'investissement dans les technologies de pointe qui redéfinissent l'avenir et remodelent des secteurs entiers.