Connect with us

Manuel Romero, Co-fondateur et Directeur scientifique de Maisa – Série d’entretiens

Entretiens

Manuel Romero, Co-fondateur et Directeur scientifique de Maisa – Série d’entretiens

mm

Manuel Romero, Co-fondateur et Directeur scientifique de Maisa, est un chercheur et ingénieur en intelligence artificielle axé sur le développement de systèmes d’intelligence artificielle fiables et de niveau entreprise. Il a co-fondé Maisa en 2024 pour créer une intelligence artificielle responsable capable d’exécuter des processus métier complexes avec transparence et contrôle. Avant Maisa, Romero a occupé des postes d’ingénieur en intelligence artificielle et d’apprentissage automatique chez des entreprises telles que Clibrain et Narrativa, où il s’est spécialisé dans le traitement du langage naturel et les systèmes d’intelligence artificielle à grande échelle. Plus tôt dans sa carrière, il a travaillé en tant qu’ingénieur logiciel full-stack et spécialiste DevOps avant de passer à la recherche et au développement d’intelligence artificielle avancée, devenant un contributeur actif à l’écosystème open-source d’intelligence artificielle.

Maisa AI développe des « travailleurs numériques » autonomes, des agents d’intelligence artificielle conçus pour automatiser des flux de travail d’entreprise complexes tout en maintenant la traçabilité, la gouvernance et la fiabilité. La plate-forme permet aux organisations de créer et de déployer des agents d’intelligence artificielle à l’aide du langage naturel, permettant ainsi l’automatisation à travers les systèmes internes et les sources de données sans une programmation extensive. En se concentrant sur la raisonnement vérifiable et l’exécution structurée, Maisa vise à surmonter les limitations courantes associées aux systèmes d’intelligence artificielle générative et à aider les entreprises à déployer en toute sécurité l’intelligence artificielle autonome à grande échelle.

Vous avez souvent insisté sur la compréhension des raisons profondes derrière les systèmes d’intelligence artificielle. D’un point de vue technique, qu’est-ce qui vous a poussé à co-fonder Maisa en 2024, et quel écart dans l’architecture d’intelligence artificielle d’entreprise croyiez-vous ne pas être abordé ?

La motivation derrière la fondation de Maisa provenait de la réalisation que la plupart des piles d’intelligence artificielle d’entreprise étaient construites autour de modèles, et non de systèmes.

Lors de l’essor de l’intelligence artificielle générative, de nombreuses entreprises se sont concentrées sur l’intégration de grands modèles de langage dans les flux de travail existants. Cependant, ces systèmes étaient souvent fragiles, opaques et difficiles à exploiter à grande échelle. Ils manquaient :

  • d’exécution déterministe là où cela importait.
  • d’observabilité forte, de traçabilité
  • de reproductibilité

Le fossé que nous avons vu était l’absence d’une véritable infrastructure d’intelligence artificielle pour les entreprises. Les entreprises construisaient des applications autour des API de modèles de langage, mais elles manquaient de quelque chose d’équivalent à une architecture d’ordinateur pour le travail de connaissance.

Maisa a été créé pour combler ce fossé en concevant une architecture centrée sur l’unité de traitement de la connaissance (KPU), un système qui permet à l’intelligence artificielle de fonctionner de manière fiable à l’intérieur des flux de travail d’entreprise réels.

Vous avez travaillé sur le traitement avancé du langage naturel et les systèmes génératifs avant de fonder Maisa. Comment ces expériences ont-elles influencé les choix architecturaux de la plate-forme ?

Mon expérience dans le traitement du langage naturel et la génération de langage, en particulier autour de la formation et de la pré-formation de modèles de langage et de grands modèles de langage (des centaines), a rendu quelque chose très clair lors de la construction de véritables systèmes sur eux. L’architecture de transformateur est extrêmement puissante, mais elle comporte au moins trois limitations fondamentales qui doivent être abordées pour l’utiliser de manière fiable en production.

La première est les hallucinations. Ces modèles génèrent du texte de manière probabiliste et peuvent produire des sorties qui semblent correctes mais ne sont pas ancrées dans des informations vérifiées.

La deuxième est les limitations de contexte. Même avec des fenêtres de contexte plus grandes, les modèles fonctionnent dans un espace de jetons borné, ce qui rend difficile la raisonnement sur de grandes ou complexes connaissances.

La troisième est l’information à jour. Les modèles pré-formés représentent un instantané des connaissances au moment de la formation, tandis que les environnements d’entreprise nécessitent des systèmes qui peuvent raisonner sur des informations constamment changeantes.

La reconnaissance de ces contraintes a façonné de nombreuses décisions architecturales derrière Maisa. Au lieu de s’appuyer uniquement sur le modèle, nous nous sommes concentrés sur la construction d’un système qui fournit un accès structuré à la connaissance, des mécanismes de validation et une exécution contrôlée afin que l’intelligence artificielle puisse fonctionner de manière fiable dans les flux de travail d’entreprise réels.

De nombreuses entreprises expérimentent l’intelligence artificielle générative mais ont du mal à aller au-delà des pilotes. D’un point de vue de conception de systèmes, quelle est la raison fondamentale pour laquelle l’échec de mise à l’échelle se produit dans de nombreuses organisations ?

De nombreuses entreprises ont du mal à aller au-delà des pilotes d’intelligence artificielle générative parce que la plupart des déploiements sont construits comme des expériences plutôt que comme des systèmes robustes. Les prototypes précoces s’appuient souvent sur l’ingénierie de prompt, une orchestration légère et des pipelines de récupération simples, qui peuvent démontrer de la valeur mais ne fournissent pas la fiabilité, l’observabilité ou le contrôle requis pour les environnements de production. Lorsque les organisations tentent de mettre à l’échelle ces systèmes, elles rencontrent des problèmes tels que des sorties incohérentes, un manque de traçabilité, des difficultés à intégrer avec les flux de travail d’entreprise et une gouvernance limitée sur la façon dont l’intelligence artificielle se comporte. Au cœur du problème, le problème est que les grands modèles de langage sont des générateurs probabilistes, tandis que les processus d’entreprise nécessitent un comportement prévisible et auditable. Sans une architecture qui ajoute de la structure autour de la raisonnement, de la validation, de l’exécution et de la surveillance, les systèmes d’intelligence artificielle générative restent difficiles à mettre à l’échelle au-delà de cas d’utilisation isolés.

Les « travailleurs numériques » de Maisa sont conçus pour être auditable et structurés plutôt que purement probabilistes. Qu’est-ce que cela signifie en termes pratiques pour les entreprises qui évaluent l’intelligence artificielle pour une utilisation de production ?

Lorsque nous disons que les « travailleurs numériques » de Maisa sont auditable et structurés plutôt que purement probabilistes, nous voulons dire que l’intelligence artificielle fonctionne dans un système contrôlé où ses actions et sa raisonnement peuvent être tracés et gouvernés. Au lieu de laisser un modèle générer librement des sorties et des décisions, le système structure la façon dont l’intelligence artificielle interagit avec les données, les outils et les flux de travail. Chaque étape du processus peut être enregistrée, inspectée et validée, et les actions sont exécutées à travers des interfaces définies plutôt que directement à partir de la sortie du modèle. Pour les entreprises, cela signifie que les systèmes d’intelligence artificielle peuvent être surveillés, audité et intégrés dans des processus critiques avec une plus grande confiance. Cela déplace l’intelligence artificielle d’un assistant boîte noire à un système dont le comportement peut être compris, contrôlé et approuvé dans les environnements de production.

En tant qu’architecte de l’unité de traitement de la connaissance, comment celle-ci diffère-t-elle d’une couche d’orchestration typique ou d’un moteur de workflow construit autour de grands modèles de langage ?

L’unité de traitement de la connaissance diffère des couches d’orchestration typiques car elle est conçue pour gérer le cycle de vie complet de la raisonnement basée sur l’intelligence artificielle plutôt que de simplement coordonner les appels de modèle et les étapes de workflow. La plupart des cadres d’orchestration agissent comme des gestionnaires de workflow qui enchaînent des étapes telles que la récupération, la sollicitation et l’exécution d’outils. L’unité de traitement de la connaissance fonctionne à un niveau architectural plus profond en structurant la façon dont la connaissance est accédée, la façon dont la raisonnement est effectuée et la façon dont les actions sont exécutées dans le système. Elle traite le traitement de la connaissance comme une couche de calcul fondamentale, en intégrant la mémoire, la validation et l’exécution contrôlée afin que l’intelligence artificielle puisse fonctionner de manière fiable à l’intérieur des flux de travail d’entreprise complexes plutôt que de simplement générer des réponses.

Dans les industries réglementées, la tolérance aux risques est faible. Quelles décisions de conception spécifiques avez-vous prises pour vous assurer que les sorties d’intelligence artificielle restent fiables et ne propagent pas d’erreurs à travers des flux de travail complexes ?

Dans les industries réglementées, la fiabilité et le contrôle sont essentiels, nous avons donc conçu le système avec plusieurs garanties pour nous assurer que les sorties d’intelligence artificielle restent fiables. Un principe clé est l’exécution structurée, où l’intelligence artificielle ne peut déclencher directement des actions critiques sans passer par des interfaces contrôlées. Nous incorporons également des couches de validation qui vérifient les sorties du modèle par rapport à des schémas, des règles ou des mécanismes secondaires avant qu’elles ne soient acceptées. De plus, le système maintient une observabilité complète, enregistrant les étapes de raisonnement, les interactions avec les outils et les décisions afin qu’elles puissent être tracées et auditées. Ensemble, ces choix de conception aident à prévenir les erreurs de propagation à travers les flux de travail et permettent aux organisations de fonctionner avec des systèmes d’intelligence artificielle avec le niveau de fiabilité et de gouvernance requis dans les environnements réglementés.

Quels sont les cas d’utilisation les plus convaincants où vous avez vu les « travailleurs numériques » passer d’une assistance guidée à une exécution complète de l’intelligence artificielle ?

Certains des cas d’utilisation les plus convaincants apparaissent dans les flux de travail à forte intensité de connaissance où les processus sont bien définis mais nécessitent toujours une analyse et une prise de décision significatives. Dans des domaines tels que l’examen de conformité, les opérations de support technique et la gestion des connaissances internes, les « travailleurs numériques » peuvent aller au-delà de l’assistance humaine et commencer à exécuter des tâches structurées de bout en bout. Ils peuvent récupérer et analyser de grandes quantités d’informations internes, appliquer des procédures définies, interagir avec les systèmes d’entreprise à l’aide d’outils contrôlés et produire des sorties qui alimentent directement les flux de travail opérationnels. Le changement clé se produit lorsque l’intelligence artificielle n’est pas seulement en train de générer des suggestions mais est capable de manière fiable d’exécuter des actions définies dans un système gouverné, permettant aux organisations d’automatiser des parties de travail de connaissance complexes plutôt que de simplement les augmenter.

À mesure que l’examen réglementaire de l’intelligence artificielle s’intensifie dans le monde, comment voyez-vous l’évolution de l’infrastructure d’intelligence artificielle pour répondre aux exigences de conformité sans limiter l’innovation ?

À mesure que l’examen réglementaire de l’intelligence artificielle augmente, je crois que nous allons voir un déplacement loin des architectures qui appellent simplement les API de fournisseurs de modèles et font confiance à la sortie aveuglément. Les entreprises et les régulateurs exigent de plus en plus des systèmes où le comportement de l’intelligence artificielle est observable, auditable et gouverné. C’est là que les architectures comme l’unité de traitement de la connaissance deviennent importantes. Ce type de système permet aux organisations d’appliquer des contrôles, de tracer les décisions et de s’assurer que les sorties d’intelligence artificielle sont fiables avant d’influencer des processus réels. Avec le temps, je m’attends à ce que ces types de systèmes deviennent la base standard pour une infrastructure d’intelligence artificielle fiable.

Vous avez parlé d’éthique et de responsabilité aux côtés de votre travail technique. Comment ces perspectives influencent-elles votre approche de la construction de systèmes d’intelligence artificielle transparents ?

L’éthique et la responsabilité, pour moi, se traduisent directement en choix de conception de systèmes. Si les systèmes d’intelligence artificielle doivent participer à des flux de travail opérationnels réels, ils ne peuvent pas fonctionner comme des boîtes noires opaques dont le comportement ne peut pas être inspecté ou compris. Cette perspective a fortement influencé ma façon d’aborder la construction de systèmes d’intelligence artificielle. La transparence, la traçabilité et la surveillance humaine doivent être intégrées dans l’architecture dès le départ. Cela signifie s’assurer que les étapes de raisonnement peuvent être observées, que les décisions peuvent être auditées et que les actions sont exécutées à travers des mécanismes contrôlés. Lorsque ces principes sont intégrés au niveau de l’infrastructure, les systèmes d’intelligence artificielle deviennent non seulement plus fiables mais aussi plus faciles pour les organisations à gérer de manière responsable.

En regardant vers l’avenir, croyez-vous que l’infrastructure d’intelligence artificielle agente deviendra aussi fondamentale que l’infrastructure cloud l’a été au cours de la décennie précédente — et qu’est-ce qui doit se produire techniquement pour que ce changement se matérialise ?

Je crois que l’infrastructure d’intelligence artificielle agente a le potentiel de devenir aussi fondamentale que l’infrastructure cloud est devenue au cours de la dernière décennie. À mesure que les organisations cherchent à automatiser un travail de connaissance de plus en plus complexe, elles auront besoin de systèmes qui peuvent coordonner de manière fiable la raisonnement, la mémoire et l’exécution à travers de nombreuses tâches et sources de données. Cependant, pour que ce changement se produise, l’architecture sous-jacente doit mûrir au-delà de simples intégrations de modèles. Nous avons besoin d’une infrastructure qui fournit une raisonnement structurée, un accès fiable aux connaissances d’entreprise, une forte observabilité et une exécution contrôlée des actions. Lorsque ces capacités sont intégrées dans le système de base, l’intelligence artificielle agente peut évoluer d’outils expérimentaux en infrastructure fiable sur laquelle les organisations s’appuient pour exécuter des opérations critiques.

Merci pour cette grande interview, les lecteurs qui souhaitent en savoir plus peuvent visiter Maisa AI.

Antoine est un leader visionnaire et partenaire fondateur de Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Un entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et se fait souvent prendre en train de vanter le potentiel des technologies perturbatrices et de l'AGI.
En tant que futurist, il se consacre à explorer comment ces innovations vont façonner notre monde. En outre, il est le fondateur de Securities.io, une plateforme axée sur l'investissement dans les technologies de pointe qui redéfinissent l'avenir et remodelent des secteurs entiers.