Intelligence artificielle
Dr. Lingjia Tang, CTO et co-fondateur, Clinc – Série d’entretiens

Dr. Lingjia Tang, CTO et co-fondateur de Clinc, est professeur de sciences informatiques à l’Université du Michigan. Les recherches du Dr Tang sur la construction d’infrastructures de production à grande échelle pour les applications intelligentes sont largement reconnues et respectées dans la communauté académique. En plus de travailler chez Microsoft et Google, Lingjia a obtenu son doctorat en sciences informatiques de l’Université de Virginie. Lingjia a récemment reçu des prix prestigieux, notamment le ISCA Hall of Fame, les Facebook Research Awards et le Google Research Award.
Qu’est-ce qui vous a initialement attiré vers l’IA ? Quand avez-vous découvert que vous vouliez lancer une entreprise d’IA ?
Au milieu des années 2000, je menais des recherches sur les systèmes à grande échelle qui supportent diverses applications et sur la façon de concevoir des serveurs en tant que système logiciel pour exécuter ces applications de manière plus efficace. À l’époque, nous passions des applications web traditionnelles à des fonctions plus axées sur l’apprentissage automatique. C’est à ce moment-là que j’ai commencé à m’intéresser aux algorithmes associés à l’IA et que j’ai acquis un intérêt pour comprendre fondamentalement le fonctionnement des applications d’IA. Peu de temps après, l’équipe de recherche avec laquelle je travaillais a décidé de changer de cap et de construire ses propres applications d’IA en tant que références pour étudier, ce qui nous a menés à la publication de nos premiers articles de recherche et au développement de notre premier produit, Sirius – un assistant personnel de voix et de vision open source.
En tant que logiciel open source, Sirius permettait aux gens de créer leurs propres assistants virtuels conversationnels. À l’époque, cette capacité était très limitée pour le grand public et était vraiment contrôlée uniquement par les grandes entreprises, telles que Google et Apple. Cependant, nous avons constaté que nous comblions un fossé critique lorsque nous avons publié le logiciel et que nous avons vu qu’il avait été téléchargé des dizaines de milliers de fois en une semaine ! C’était le point de basculement où nous avons su qu’il y avait une grande demande pour ce type de logiciel.
Vers 2015, nous avons lancé Clinc avec l’idée que nous pourrions fournir à tout le monde – chaque développeur, chaque entreprise, chaque personne – qui veut être en mesure de construire un assistant virtuel avec l’accès à l’expertise, aux outils et à l’innovation pour être en mesure de le faire.
Clinc propose des solutions d’IA conversationnelle sans s’appuyer sur des mots clés ou des scripts. Pouvez-vous entrer dans les détails sur la façon dont cela est réalisé ? Quels sont certains des défis de traitement du langage naturel (NLP) qui ont dû être surmontés ?
Ce qui distingue vraiment Clinc des autres plateformes d’IA conversationnelle sur le marché, ce sont les algorithmes d’IA sous-jacents qui permettent son expérience “humain dans la pièce”, qui comprend le langage désordonné et non scripté. Cela permet des corrections pour revenir en arrière et “guérir” les erreurs commises dans la conversation humaine et permet des flux de conversation complexes – des conversations que un véritable humain pourrait comprendre. Contrairement à un algorithme de correspondance de mots de parole à texte, Clinc analyse des dizaines de facteurs à partir de la saisie de l’utilisateur, y compris les mots, les sentiments, les intentions, le ton de la voix, l’heure de la journée, l’emplacement et les relations, et utilise ces facteurs pour fournir une réponse qui représente une combinaison de connaissances extraites de son cerveau formé. Par exemple, si je demande à mon assistant virtuel : “Combien d’argent ai-je dépensé pour un burger ?”, il doit comprendre que je demande des informations sur l’argent et les dépenses, que je demande spécifiquement un hamburger et qu’un hamburger est un type de nourriture qui doit être associé à mes dépenses récentes dans un restaurant.
Atteindre ce niveau de compréhension n’est pas facile. En général, nous diviserions l’IA conversationnelle en deux composants : la compréhension du langage naturel (NLU) et la gestion du dialogue. Le défi que nous avons dû surmonter était de déterminer comment construire un système capable d’extraire des informations clés avec précision et d’anticiper ce que l’utilisateur demande.
Nous pouvons le faire grâce à une NLU contextuelle et descendante sophistiquée, qui est formée pour être intuitive par nature afin de suivre le flux naturel de la conversation, en comprenant les expressions idiomatiques et le contexte. Cela se compare aux solutions concurrentes qui ont une approche descendante et basée sur des règles pour le traitement du langage naturel (NLP) qui n’autorise pas la “guérison” conversationnelle, ce qui signifie que si le client fait une erreur, les solutions concurrentes les obligent à revenir au point de départ, gaspillant du temps et ne frustrant que l’utilisateur. Nous utilisons également le crowdsourcing pour extraire nos données linguistiques et créer un ensemble de données plus riche et plus diversifié qui peut être utilisé immédiatement pour former des modèles d’IA.
Pouvez-vous discuter de la façon dont l’apprentissage profond est utilisé avec le système d’IA Clinc ?
Clinc utilise une approche hybride de l’apprentissage profond où nous utilisons le modèle traditionnel classique dans une certaine mesure et exploitons l’apprentissage profond lorsque cela est nécessaire. Plus précisément, nous utilisons l’apprentissage profond pour comprendre les mots et les langues pour déterminer le flux de dialogue. Généralement, notre dialogue entier est une combinaison d’apprentissage profond et d’IA symbolique. Nous n’utilisons pas encore l’apprentissage profond pour la génération de langage, car lorsqu’il s’agit de nos clients, qui sont principalement dans le secteur bancaire, il existe de nombreuses réglementations que l’assistant virtuel doit suivre qui dictent ce qu’il peut et ne peut pas dire à ses clients. Il y a donc encore beaucoup d’incertitude sur le fait que l’apprentissage profond sera en mesure de suivre ces restrictions de langage établies.
Actuellement, je ne pense pas que la communauté de l’IA conversationnelle soit complètement prête à adopter pleinement l’apprentissage profond, alors que la communauté universitaire est à 100 % convaincue, mais j’ai hâte de voir ce que les nouveaux modèles peuvent faire.
Quel est le processus pour une entreprise qui souhaite personnaliser les réponses de l’IA pour cibler un public spécifique ? Pouvez-vous donner des exemples de la façon dont Clinc est actuellement utilisé par les clients ?
Nous autorisons les clients à soit licencier une plate-forme qu’ils peuvent construire comme ils le souhaitent, soit prendre notre chatbot entièrement construit et formé, Finie, et le personnaliser et l’intégrer à leurs applications ou services de messagerie. Finie peut gérer les questions relatives aux soldes, aux transactions, à l’historique des dépenses, à la localisation d’un distributeur automatique de billets, à l’exécution d’un virement et plus encore.
Mon exemple préféré de la façon dont un client a personnalisé l’IA de Clinc pour cibler un public spécifique est İşbank. En tant que plus grande banque privée de Turquie, ils se sont tournés vers nous pour développer leur assistant bancaire numérique, Maxi, en 2018. Pour infuser Maxi d’une personnalité unique, İşbank a organisé 14 groupes de discussion pour évaluer les traits et les compétences que les clients de la banque souhaitaient voir dans un assistant virtuel. Ils ont également embauché une actrice vocale pour réciter des phrases en turc liées aux tâches bancaires. L’équipe de banque en ligne d’İşbank a créé ces phrases en considérant la façon dont les gens réels exprimeraient leurs besoins. Sur notre recommandation, l’équipe a payé des participants sur des marchés de crowdsourcing tels que Amazon Mechanical Turk pour fournir différentes façons dont ils pourraient exprimer les mêmes questions, comme une demande pour afficher leurs soldes (“quel est mon solde”, “combien d’argent ai-je sur mon compte”, “montrez-moi l’argent sur mon compte”) ou pour payer une facture (“payer ma facture”, “paiement de facture”).
Cet exemple montre vraiment à quel point İşbank est investi dans l’offre d’un assistant bancaire numérique pour aider ses clients à mieux naviguer dans leurs comptes. Avec Clinc, İşbank a lancé Maxi à plus de 7,5 millions de personnes, en turc. Depuis son lancement, İşbank a vu une adoption généralisée par plus de 5,5 millions d’utilisateurs, avec une moyenne de 9,8 interactions par utilisateur. Ces derniers mois, à mesure que les cas de COVID-19 augmentaient en Turquie, İşbank a rapidement formé Maxi pour répondre aux requêtes liées au COVID-19. Depuis mars 2020, Maxi a répondu à plus de 1,2 million de requêtes de clients liées au COVID-19, soit une augmentation de plus de 62 % de l’utilisation.
Que diriez-vous aux femmes qui sont intéressées par l’apprentissage de plus en plus sur l’IA mais hésitent à s’impliquer en raison du fait que c’est un domaine dominé par les hommes ?
Tout d’abord, je ne pense pas qu’il y ait de raison pour laquelle l’IA soit considérée comme un domaine dominé par les hommes. Je pense qu’il y a de nombreuses pionnières de l’IA qui font vraiment du bon travail et ont un impact. Je pense que l’IA couplée à la politique sociale est un domaine unique qui a le potentiel d’avoir un grand impact sur la vie quotidienne des gens. C’est là que je pense que des perspectives diverses à tous les niveaux seraient vraiment bénéfiques, notamment parce qu’il y a de nombreuses conversations autour des préjugés de l’IA impliquant la race et le sexe. Je crois que disposer d’une communauté ciblée de développeurs d’IA continuera d’avoir un impact disproportionné sur la société et la politique.
Pour les femmes qui s’intéressent à rejoindre le domaine de l’IA, je le recommande vivement, surtout si vous êtes intéressées à avoir un impact. L’IA a connu une croissance et une innovation telles au fil des ans, et c’est vraiment un moment passionnant pour en faire partie.
Y a-t-il autre chose que vous aimeriez partager sur Clinc ?
Clinc fait actuellement de grands progrès. Personnellement, je viens de prendre un nouveau rôle en tant que CTO de Clinc et je suis vraiment enthousiaste à l’idée de me concentrer sur la façon dont nous pouvons travailler davantage avec les développeurs et les scientifiques des données pour accroître la portée de notre technologie. Alors que je regarde vers l’avenir, je vois la demande d’applications alimentées par l’IA se déplacer pour permettre aux personnes qui n’ont pas des années d’expérience en science des données et en apprentissage automatique d’être en mesure de l’utiliser également. Par exemple, vous n’avez pas besoin d’un diplôme en design graphique pour être en mesure d’utiliser Photoshop. Je pense que l’IA va dans cette direction où les développeurs sans formation en IA ou en apprentissage automatique seront en mesure d’obtenir des résultats et de produire des applications de haute qualité. Dans l’ensemble, nous voulons réitérer que nous sommes dédiés non seulement à l’utilisateur final, mais également aux développeurs, quel que soit leur niveau, qui s’intéressent à notre solution.
Je vous remercie pour cette grande interview, j’ai hâte de suivre vos progrès. Quiconque qui souhaite en savoir plus devrait visiter Clinc.












