Suivez nous sur

Ricky Costa, PDG de Quantum Stat – Série d'interviews

Interviews

Ricky Costa, PDG de Quantum Stat – Série d'interviews

mm

Ricky Costa est le PDG de Quantum Stat, une entreprise qui propose des solutions commerciales pour PNL et initiatives d'IA

Qu'est-ce qui vous a initialement intéressé à l'intelligence artificielle ?

Le hasard. Je lisais un livre sur les probabilités lorsque je suis tombé sur un théorème célèbre. À l’époque, je me demandais naïvement si je pouvais appliquer ce théorème à un problème de langage naturel que j’essayais de résoudre au travail. Il s’avère que l’algorithme existait déjà à mon insu, il s’appelait le Naïve Bayes, un modèle génératif très célèbre et simple utilisé dans l’apprentissage automatique classique. Ce théorème était le théorème de Bayes. J'ai senti que cette coïncidence était un indice et j'ai semé une graine de curiosité pour continuer à en apprendre davantage.

 

Vous êtes le PDG de Quantum Stat, une entreprise qui propose des solutions de traitement du langage naturel. Comment vous êtes-vous retrouvé dans cette position ?

Lorsqu'il y a une révolution dans une nouvelle technologie, certaines entreprises sont plus hésitantes que d'autres face à l'inconnu. J'ai créé mon entreprise parce que poursuivre l'inconnu m'amuse. J'ai également senti que c'était le bon moment pour m'aventurer dans le domaine de la PNL étant donné toutes les recherches incroyables qui sont arrivées au cours des 2 dernières années. La communauté PNL a désormais la capacité d'accomplir beaucoup plus avec beaucoup moins grâce à l'avènement de nouvelles techniques PNL qui nécessitent moins de données pour faire évoluer les performances.

 

Pour les lecteurs qui ne connaissent peut-ĂŞtre pas ce domaine, pourriez-vous partager avec nous ce que fait le traitement automatique du langage naturel ?

La PNL est un sous-domaine de l'IA et de l'analyse qui tente de comprendre le langage naturel dans le texte, la parole ou l'apprentissage multimodal (texte et images/vidéo) et de le calculer au point où vous générez des informations et/ou fournissez un service précieux. La valeur peut provenir de plusieurs angles, de la récupération d'informations dans le système de fichiers interne d'une entreprise, à la classification des sentiments dans les actualités, ou un bot Twitter GPT-2 qui aide à votre marketing sur les réseaux sociaux (comme celui que nous avons construit il y a quelques semaines).

 

Vous avez un baccalaurĂ©at ès arts du Hunter College en psychologie expĂ©rimentale. Pensez-vous que comprendre le cerveau humain et la psychologie humaine est un atout lorsqu'il s'agit de comprendre et d'Ă©largir le domaine du traitement automatique du langage naturel ?

C'est à contre-courant, mais malheureusement, non. L'analogie des neurones et des réseaux de neurones profonds est simplement à titre d'illustration et inculque l'intuition. On peut probablement apprendre beaucoup plus de la science et de l'ingénierie de la complexité. La difficulté pour comprendre le fonctionnement du cerveau est que nous avons affaire à un système complexe. « L'intelligence » est un phénomène émergent de la complexité du cerveau en interaction avec son environnement, et très difficile à cerner. La psychologie et les autres sciences sociales, qui dépendent du « réductionnisme » (descendant) ne fonctionnent pas sous ce paradigme complexe. Voici l'intuition : imaginez quelqu'un essayant de réduire la chanson des Beatles « Let it Be » à la gamme de do majeur. Il n'y a rien dans cette échelle qui prédit que "Let it Be" en sortira. Il en va de même pour quelqu'un qui tente de réduire le comportement à une activité neuronale dans le cerveau.

 

Pourriez-vous nous expliquer pourquoi le Big Data est si important en matière de Deep Learning et plus particulièrement de traitement du langage naturel ?

Dans l'état actuel des choses, étant donné que les modèles d'apprentissage en profondeur interpolent les données, plus vous introduisez de données dans le modèle, moins il verra de cas extrêmes lors d'une inférence dans la nature. Cette architecture « incite » de grands ensembles de données à être calculés par des modèles afin d'augmenter la précision de la sortie. Cependant, si nous voulons obtenir un comportement plus intelligent des modèles d'IA, nous devons regarder au-delà de la quantité de données dont nous disposons et davantage sur la façon dont nous pouvons améliorer la capacité de la capacité du modèle à raisonner plus efficacement, ce qui, intuitivement, ne devrait pas nécessiter beaucoup de données. Du point de vue de la complexité, les expériences sur les automates cellulaires menées au siècle dernier par les physiciens John von Neumann et Stephen Wolfram montrent que la complexité peut émerger de conditions et de règles initiales simples. Ce que ces conditions/règles devraient être en ce qui concerne l'IA, c'est ce que tout le monde recherche.

 

Vous avez rĂ©cemment lancĂ© la 'Big Bad NLP Database'. Qu'est-ce que cette base de donnĂ©es et pourquoi est-elle importante pour les acteurs de l'industrie de l'IA ?

Cette base de données a été créée pour que les développeurs NLP aient un accès transparent à tous les ensembles de données pertinents de l'industrie. Cette base de données aide à indexer les ensembles de données, ce qui a pour effet secondaire de pouvoir être interrogé par les utilisateurs. Le prétraitement des données prend la majorité du temps dans le pipeline de déploiement, et cette base de données tente d'atténuer ce problème autant que possible. De plus, il s'agit d'une plate-forme gratuite pour tous, que vous soyez un chercheur universitaire, un praticien ou un gourou indépendant de l'IA qui souhaite se familiariser avec les données de la PNL. Lien

 

Quantum Stat propose actuellement des solutions de bout en bout. Quelles sont certaines de ces solutions ?

Nous aidons les entreprises à faciliter leur pipeline de modélisation NLP en proposant un développement à n'importe quelle étape. Nous pouvons couvrir une large gamme de services allant du nettoyage des données dans la phase de prétraitement jusqu'au déploiement du serveur modèle en production (ces services sont également mis en évidence sur notre page d'accueil). Tous les projets d'IA ne se concrétisent pas en raison de la nature inconnue du fonctionnement de votre architecture de données/projet spécifique avec un modèle de pointe. Compte tenu de cette incertitude, nos services donnent aux entreprises la possibilité d'itérer leur projet à la fraction du coût de l'embauche d'un ingénieur ML à temps plein.

 

Quelle avancĂ©e rĂ©cente de l'IA trouvez-vous la plus intĂ©ressante ?

L'avancĂ©e la plus importante de ces derniers temps est le modèle de transformateur, vous en avez peut-ĂŞtre entendu parler : BERT, RoBERTa, ALBERT, T5, etc. Ces modèles de transformateurs sont très attrayants car ils permettent au chercheur d'obtenir des performances de pointe avec des ensembles de donnĂ©es plus petits. Avant les transformateurs, un dĂ©veloppeur aurait besoin d'un très grand ensemble de donnĂ©es pour former un modèle Ă  partir de zĂ©ro. Étant donnĂ© que ces transformateurs sont prĂ©-formĂ©s sur des milliards de mots, cela permet une itĂ©ration plus rapide des projets d'IA et c'est ce Ă  quoi nous sommes principalement impliquĂ©s en ce moment.

 

Y a-t-il autre chose que vous aimeriez partager Ă  propos de Quantum Stat ?

Nous travaillons sur un nouveau projet traitant de l'analyse du sentiment des marchés financiers qui sera bientôt publié. Nous avons exploité plusieurs transformateurs pour donner un aperçu sans précédent de la façon dont les nouvelles financières se déroulent en temps réel. Restez à l'écoute!

Pour en savoir plus, visitez Quantum Stat ou lisez notre article sur le Base de données Big Bad NLP.

Antoine est un leader visionnaire et partenaire fondateur d'Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et on le surprend souvent en train de s'extasier sur le potentiel des technologies disruptives et de l'AGI.

En futuriste, il se consacre à l'exploration de la manière dont ces innovations façonneront notre monde. En outre, il est le fondateur de Titres.io, une plateforme axée sur l’investissement dans les technologies de pointe qui redéfinissent l’avenir et remodèlent des secteurs entiers.