Interviews
Francisco Webber, co-fondateur et PDG de Cortical.io – Série d'interviews

Francisco Webber est co-fondateur et PDG de Cortical.io et inventeur de la technologie exclusive Retina de l'entreprise. Cette technologie applique les principes du traitement cérébral à l'apprentissage automatique et à la compréhension du langage naturel (NLU) pour résoudre des cas d'utilisation réels liés aux mégadonnées textuelles. Les solutions Cortical.io sont basées sur la signification réelle du texte, plutôt que sur des occurrences statistiques.
L'intérêt de Francisco pour les technologies de l'information s'est développé au cours de ses études de médecine, alors qu'il était impliqué dans le traitement des données médicales. Au cours de deux décennies, il a exploré les technologies des moteurs de recherche et les systèmes de documentation dans divers contextes, mais est devenu de plus en plus frustré par les limites des méthodes statistiques de pointe.
En 2005, il a fondé Matrixware Information Services, qui a développé la première base de données mondiale normalisée sur les brevets. En 2007, il a créé l'Information Retrieval Facility avec le professeur Keith van Rijsbergen, expert universitaire de premier plan dans le domaine de la recherche d'informations. La Facilité visait à combler le fossé entre les universités et l'industrie dans le domaine de la recherche d'informations. Francisco a reconnu que le cerveau était le seul système de référence existant en matière de traitement du langage naturel. Tout en suivant de près les développements des neurosciences, il a formulé sa théorie du Semantic Folding, qui modélise la façon dont le cerveau représente les données du langage.
Qu'est-ce qui vous a d'abord poussé à vous impliquer dans Compréhension du langage naturel (NLU) ?
Mon intérêt pour les technologies de l'information s'est développé au cours de mes études de médecine, alors que j'étais impliqué dans l'informatique médicale. Au cours de deux décennies, j'ai exploré les technologies des moteurs de recherche et les systèmes de documentation dans divers contextes, mais j'ai été de plus en plus frustré par les limites des méthodes statistiques de pointe. J'ai reconnu que le cerveau était le seul système de référence existant lorsqu'il s'agissait de traiter le langage naturel.
Vous êtes à la fois fondateur et PDG de Cortical.io. Pourriez-vous partager l'histoire de la genèse de cette entreprise ?
Nous savions que nous disposions d'une technologie qui permettrait aux entreprises de rechercher plus rapidement, plus précisément et plus efficacement, d'extraire, d'annoter et d'analyser des informations à partir de textes non structurés. Notre technologie NLU basée sur l'IA pourrait être un véritable différenciateur pour relever le défi du traitement des données textuelles non structurées car elle comprend le sens des phrases, des paragraphes et des concepts, pas seulement des mots-clés et, par conséquent, fournit des résultats très précis. Au fur et à mesure que les leaders de l'industrie apprenaient ce que nous avions, cela nous a permis de tester notre approche dans le cadre d'exigences réelles et complexes. Cela a abouti à de nombreux succès commerciaux Fortune 500. Ceux-ci sont devenus les modèles de nos produits de renseignement sur les contrats et les messages.
La technologie Cortical.io est basée sur la Livre blanc sur la théorie du pliage sémantique (SFT), une théorie computationnelle innovante pour le traitement des données linguistiques. Quelles sont certaines des limitations actuelles de la manière dont la plupart des IA s'attaquent à la NLU ?
Les approches standard d'IA et de ML impliquent la création de modèles statistiques à grande échelle qui sont entraînés à l'aide de quantités massives de données d'entraînement. Souvent, des quantités suffisantes de données de formation ne sont pas facilement disponibles, et les experts en la matière n'ont pas le temps d'annoter de si grandes quantités de documents. De plus, la formation de grands modèles (avec des milliards de paramètres) nécessite d'énormes ressources de calcul, ce qui coûte cher et consomme beaucoup d'énergie. Un modèle linguistique type consomme plus d'énergie que cinq voitures sur toute leur durée de vie !
La théorie du pliage sémantique est construite au-dessus de la Théorie de la mémoire temporelle hiérarchique (HTM). Pourriez-vous décrire brièvement ce qu'est cette théorie?
La mémoire temporelle hiérarchique (HTM) est une théorie biologiquement contrainte de l'intelligence décrite à l'origine dans le livre de Jeff Hawkins On Intelligence. Il s'agit d'un cadre d'intelligence artificielle strictement basé sur les neurosciences et la physiologie et l'interaction des neurones dans le cerveau. Dans cette théorie, le cerveau agit comme un système de mémoire qui stocke des modèles et fait des prédictions à partir d'expériences actuelles basées sur des modèles mémorisés. Pour être vraiment intelligentes, les machines doivent recréer ce système de mémoire-prédiction. Hawkins décrit les représentations distribuées clairsemées comme le seul format de données utilisé par le néocortex. Les empreintes sémantiques utilisées dans notre technologie sont des représentations distribuées clairsemées de texte (de mots, de phrases ou de paragraphes).
Pourriez-vous nous expliquer en quoi la méthode SFT est supérieure aux stratégies NLU concurrentes ?
La théorie du pliage sémantique qui soutient la technologie Cortical.io présente plusieurs avantages importants. Tout d'abord, il ne nécessite pas un énorme référentiel d'échantillons de données pour fournir des résultats précis. Deuxièmement, il est rapide et nécessite moins de ressources informatiques que les algorithmes d'apprentissage automatique de pointe. Enfin, le processus de formation est beaucoup plus simple et peut être géré par les experts en la matière qui utiliseront le système, même s'ils n'ont aucune expérience en IA.
Un des produits de Cortical.io est Message Intelligence, quelle est précisément cette application ?
Message Intelligence s'inscrit dans la catégorie connue sous le nom de traitement intelligent des documents. Les entreprises sont submergées par le traitement d'un large éventail de messages et de documents. Message Intelligence est une solution prête à l'emploi qui utilise la technologie de Cortical.io pour extraire et classer avec précision les informations clés de ces messages et documents et les traiter de manière appropriée à l'échelle de l'entreprise. En raison de l'approche brevetée de Cortical.io, il est possible de développer des classificateurs personnalisés en quelques heures et des modèles d'extraction en quelques jours.
Un autre produit proposé est Intelligence contractuelle, pourriez-vous partager quelques détails à ce sujet ?
Cortical.io Contract Intelligence s'appuie sur une nouvelle approche de la compréhension du langage naturel pour analyser rapidement et avec une précision des informations pertinentes à partir de grandes quantités de documents qu'il est difficile d'atteindre à grande échelle avec du travail manuel ou avec d'autres outils d'analyse de contrats. La solution offre un puissant outil basé sur le sens pour extraire et classer les informations clés, rechercher dans des documents individuels ou dans l'ensemble de la base de données, ainsi que pour comparer des documents à un modèle ou à des versions précédentes.
Y a-t-il autre chose que vous aimeriez partager Ă propos de Cortical.io ?
Nous sommes ravis de voir la maturation de l'intelligence artificielle et de la compréhension du langage naturel d'une technologie intéressante à son intégration dans des applications qui résolvent des problèmes commerciaux réels.
Merci pour cette excellente interview, les lecteurs qui souhaitent en savoir plus devraient visiter Cortical.io.












