Connect with us

Eric Landau, Co-Fondateur & PDG d’Encord – Série d’entretiens

Entretiens

Eric Landau, Co-Fondateur & PDG d’Encord – Série d’entretiens

mm

Eric Landau est le PDG et co-fondateur d’Encord, une plateforme d’apprentissage actif pour la vision par ordinateur. Eric était le chercheur quantitatif principal sur un bureau de delta-one des actions mondiales, mettant ainsi des milliers de modèles en production. Avant Encord, il a passé près d’une décennie dans la négociation à haute fréquence chez DRW. Il détient un S.M. en physique appliquée de l’Université de Harvard, un M.S. en ingénierie électrique et un B.S. en physique de l’Université de Stanford.

Dans son temps libre, Eric aime jouer avec ChatGPT et les grands modèles de langage, ainsi que créer des cocktails artisanaux.

Qu’est-ce qui vous a inspiré pour co-fonder Encord, et comment votre expérience en physique des particules et en finance quantitative a-t-elle façonné votre approche pour résoudre le « problème de données » en IA ?

J’ai commencé à réfléchir à l’apprentissage automatique pendant que je travaillais en physique des particules et que je traitais de très grands ensembles de données pendant mon séjour au Stanford Linear Accelerator Center (SLAC). J’utilisais des logiciels conçus pour les physiciens par les physiciens, ce qui signifie qu’il y avait beaucoup à désirer en termes d’expérience utilisateur agréable. Avec des outils plus faciles à utiliser, j’aurais pu exécuter des analyses beaucoup plus rapidement.

Plus tard, en travaillant dans la finance quantitative chez DRW, j’étais responsable de la création de milliers de modèles qui ont été déployés en production. Semblable à mon expérience en physique, j’ai constaté que des données de haute qualité étaient essentielles pour créer des modèles précis et que la gestion de données complexes et à grande échelle est difficile. Ulrik a eu une expérience similaire en visualisant de grands ensembles de données d’images pour la vision par ordinateur.

Lorsque j’ai entendu parler de son idée initiale pour Encord, j’étais immédiatement à bord et j’ai compris l’importance. Ensemble, Ulrik et moi avons vu une énorme opportunité de construire une plateforme pour automatiser et rationaliser le processus de développement de données pour l’IA, facilitant ainsi pour les équipes l’accès aux meilleures données et la création de systèmes d’IA fiables.

Pouvez-vous élaborer sur la vision derrière Encord et comment elle se compare aux débuts de l’informatique ou d’Internet en termes de potentiel et de défis ?

La vision d’Encord est d’être la plateforme fondamentale sur laquelle les entreprises comptent pour transformer leurs données en modèles d’IA fonctionnels. Nous sommes la couche entre les données d’une entreprise et son IA.

De nombreuses manières, l’IA reflète les changements de paradigme précédents comme l’informatique personnelle et Internet, car elle deviendra intégrale aux flux de travail de chaque individu, entreprise, nation et industrie. Contrairement aux révolutions technologiques précédentes, qui ont été en grande partie bloquées par la loi de Moore de croissance computationnelle composée de 30 fois tous les 10 ans, le développement de l’IA a bénéficié d’innovations simultanées. Il se déplace ainsi à un rythme beaucoup plus rapide. Pour citer les mots de Jensen Huang de NVIDIA : « Pour la première fois, nous voyons des exponentielles composées… Nous composons à un million de fois tous les dix ans. Pas cent fois, pas mille fois, un million de fois. » Sans exagération, nous sommes témoins de la technologie la plus rapide de l’histoire de l’humanité.

Le potentiel est énorme : en automatisant et en mettant à l’échelle la gestion de données de haute qualité pour l’IA, nous traitons un goulet d’étranglement qui empêche une adoption plus large de l’IA. Les défis sont rappelants des obstacles rencontrés aux débuts des précédentes ères technologiques : les silos, le manque de bonnes pratiques, les limitations pour les utilisateurs non techniques et la pénurie d’abstractions bien définies.

Encord Index est positionné comme un outil clé pour gérer et curer les données d’IA. Comment se différencie-t-il des autres plateformes de gestion de données actuellement disponibles ?

Il y a quelques façons dont Encord Index se démarque :

Index est évolutif : permet aux utilisateurs de gérer des milliards, et non des millions, de points de données. D’autres outils rencontrent des problèmes d’évolutivité pour les données non structurées et sont limités dans la consolidation de toutes les données pertinentes au sein d’une organisation.

Index est flexible : s’intègre directement avec les fournisseurs de stockage de données privées et de stockage cloud tels qu’AWS, GCP et Azure. Contrairement à d’autres outils limités à un seul fournisseur de cloud ou à un système de stockage interne, Index est agnostique quant à l’emplacement des données. Il permet de gérer les données provenant de multiples sources avec les contrôles d’accès et de gouvernance appropriés, permettant ainsi de développer des applications d’IA sécurisées et conformes.

Index est multimodal : prend en charge l’IA multimodale, en gérant des données sous forme d’images, de vidéos, d’audio, de texte, de documents et plus. Index n’est pas limité à une seule forme de données comme de nombreux outils LLM aujourd’hui. La cognition humaine est multimodale, et nous croyons que l’IA multimodale sera au cœur de la prochaine vague de progrès de l’IA, qui remplacera les chatbots et les LLM.

De quelle manière Encord Index améliore-t-il le processus de sélection des bonnes données pour les modèles d’IA, et quel impact cela a-t-il sur les performances du modèle ?

Encord Index améliore la sélection des données en automatisant la curation de grands ensembles de données, aidant les équipes à identifier et à conserver uniquement les données les plus pertinentes tout en supprimant les données non informatives ou biaisées. Ce processus non seulement réduit la taille des ensembles de données mais améliore également considérablement la qualité des données utilisées pour la formation des modèles d’IA. Nos clients ont constaté une amélioration de jusqu’à 20 % de leurs modèles tout en réalisant une réduction de 35 % de la taille de l’ensemble de données et en économisant des centaines de milliers de dollars en coûts de calcul et d’annotation humaine.

Avec l’intégration rapide de technologies de pointe comme le modèle Segment Anything de Meta, comment Encord reste-t-il en tête dans le paysage de l’IA en constante évolution ?

Nous avons intentionnellement construit la plateforme pour être en mesure de s’adapter rapidement aux nouvelles technologies. Nous nous concentrons sur la fourniture d’une approche logicielle évolutivité qui intègre facilement les avancées comme SAM, garantissant que nos utilisateurs sont toujours équipés des derniers outils pour rester compétitifs.

Nous prévoyons de rester en tête en nous concentrant sur l’IA multimodale. La plateforme Encord peut déjà gérer des types de données complexes tels que les images, les vidéos et le texte, donc à mesure que davantage de progrès en IA multimodale se présentent, nous sommes prêts.

Quels sont les défis les plus courants auxquels les entreprises sont confrontées lors de la gestion des données d’IA, et comment Encord aide-t-il à résoudre ces problèmes ?

Il y a trois principaux défis auxquels les entreprises sont confrontées :

  • Une mauvaise organisation et des contrôles des données : Lorsque les entreprises préparent la mise en œuvre de solutions d’IA, elles sont souvent confrontées à la réalité de données silotées et non organisées qui ne sont pas prêtes pour l’IA. Ces données manquent souvent d’une gouvernance solide, limitant ainsi leur utilisation dans les systèmes d’IA.
  • Un manque d’experts humains : À mesure que les modèles d’IA traitent des problèmes de plus en plus complexes, il y aura bientôt une pénurie d’experts humains pour préparer et valider les données. À mesure que les demandes d’IA d’une entreprise augmentent, il est difficile et coûteux de mettre à l’échelle cette main-d’œuvre humaine.
  • Des outils non évolutifs : Les modèles d’IA performants sont très gourmands en données pour la fine-tuning, la validation, RAG et d’autres flux de travail. La génération précédente d’outils n’est pas équipée pour gérer la quantité de données et les types de données nécessaires pour les modèles de production actuels.

Encord résout ces problèmes en automatisant le processus de curation des données à grande échelle, facilitant ainsi l’identification des données impactantes par rapport aux données problématiques et garantissant la création de jeux de données de formation et de validation efficaces. Il utilise une approche logicielle qui est facile à mettre à l’échelle en fonction des besoins changeants de gestion des données. Nos outils d’annotation assistés par l’IA permettent aux experts humains dans le domaine de maximiser l’efficacité du flux de travail. Ce processus est particulièrement crucial dans des secteurs tels que les services financiers et les soins de santé, où les formateurs d’IA sont coûteux. Nous facilitons la gestion et la compréhension de toutes les données non structurées au sein d’une organisation, réduisant ainsi le besoin de travail manuel.

Comment Encord aborde-t-il le problème des biais de données et des zones sous-représentées au sein des ensembles de données pour garantir des modèles d’IA équitables et équilibrés ?

Lutter contre les biais de données est un objectif crucial pour nous chez Encord. Notre plateforme identifie et met en surface les zones où les données pourraient être biaisées, permettant ainsi aux équipes d’IA de résoudre ces problèmes avant qu’ils n’affectent les performances du modèle. Nous nous assurons également que les zones sous-représentées au sein des ensembles de données sont correctement incluses, ce qui aide à développer des modèles d’IA plus justes et plus équilibrés. En utilisant nos outils de curation, les équipes peuvent être certaines que leurs modèles sont formés sur des données diverses et représentatives.

Encord a récemment obtenu 30 millions de dollars en financement de série B. Comment ce financement accélérera-t-il votre feuille de route de produit et vos plans d’expansion ?

Les 30 millions de dollars en financement de série B seront utilisés pour augmenter considérablement la taille de nos équipes de produit, d’ingénierie et de recherche en IA au cours des six prochains mois et accélérer le développement d’Encord Index et d’autres nouvelles fonctionnalités. Nous élargissons également notre présence à San Francisco avec un nouveau bureau, et ce financement nous aidera à mettre à l’échelle nos opérations pour soutenir notre base de clients en constante croissance.

En tant que la plus jeune entreprise d’IA issue de Y Combinator à lever un financement de série B, à quoi attribuez-vous la croissance et le succès rapides d’Encord ?

L’une des raisons pour lesquelles nous avons pu grandir rapidement est que nous avons adopté une focalisation extrêmement centrée sur le client dans toutes les zones de l’entreprise. Nous sommes constamment en communication avec les clients, écoutons attentivement leurs problèmes et « les serrons dans nos bras » pour parvenir à des solutions. En nous concentrant hyper sur les besoins des clients plutôt que sur l’hype, nous avons créé une plateforme qui résonne avec les meilleures équipes d’IA dans diverses industries. Nos clients ont été instrumentaux pour nous amener où nous sommes aujourd’hui. Notre capacité à grandir rapidement et à gérer efficacement la complexité des données d’IA nous a rendus une solution attrayante pour les entreprises.

Nous devons également une grande partie de notre succès à nos collègues, partenaires et investisseurs, qui ont tous travaillé sans relâche pour défendre Encord. Travailler avec des équipes de produit, d’ingénierie et de mise sur le marché de classe mondiale a eu un impact énorme sur notre croissance.

Étant donné l’importance croissante des données dans l’IA, comment voyez-vous l’évolution du rôle des plateformes de données d’IA comme Encord au cours des cinq prochaines années ?

À mesure que les applications d’IA gagnent en complexité, le besoin de solutions de gestion de données efficaces et évolutives ne fera que croître. Je crois que chaque entreprise aura finalement un département d’IA, tout comme les départements IT existent aujourd’hui. Encord sera la seule plateforme dont ils auront besoin pour gérer les vastes quantités de données nécessaires pour l’IA et mettre les modèles en production rapidement.

Je vous remercie pour cette excellente interview. Les lecteurs qui souhaitent en savoir plus peuvent visiter Encord.

Antoine est un leader visionnaire et partenaire fondateur de Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Un entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et se fait souvent prendre en train de vanter le potentiel des technologies perturbatrices et de l'AGI.
En tant que futurist, il se consacre à explorer comment ces innovations vont façonner notre monde. En outre, il est le fondateur de Securities.io, une plateforme axée sur l'investissement dans les technologies de pointe qui redéfinissent l'avenir et remodelent des secteurs entiers.