Intelligence artificielle
Qu’est-ce que la CNL (ComprĂ©hension du Langage Naturel) ?

La compréhension du langage naturel (CNL) est un concept technique dans le cadre plus large du traitement automatique des langues. La CNL est le processus responsable de la traduction de mots humains naturels en un format que l’ordinateur peut interpréter. Essentiellement, avant qu’un ordinateur puisse traiter des données linguistiques, il doit comprendre les données.
Les techniques de CNL incluent l’utilisation de la syntaxe et des règles grammaticales courantes pour permettre à l’ordinateur de comprendre le sens et le contexte du langage humain naturel. L’objectif ultime de ces techniques est que l’ordinateur acquière une « compréhension intuitive » du langage, capable d’écrire et de comprendre le langage de la même manière qu’un humain, sans avoir constamment à se référer aux définitions des mots.
Définition de la CNL (Compréhension du Langage Naturel)
Il existe de nombreuses techniques que les informaticiens et les experts en TAL utilisent pour permettre aux ordinateurs de comprendre le langage humain. La plupart de ces techniques relèvent de la catégorie de l’« analyse syntaxique ». Les techniques d’analyse syntaxique incluent :
- lemmatisation
- racinisation
- segmentation de mots
- analyse syntaxique
- segmentation morphologique
- division de phrases
- étiquetage de la partie du discours
Ces techniques d’analyse syntaxique appliquent des règles grammaticales à des groupes de mots et tentent d’en déduire le sens. En revanche, la CNL fonctionne en utilisant des techniques d’« analyse sémantique ».
L’analyse sémantique applique des algorithmes informatiques au texte, en essayant de comprendre le sens des mots dans leur contexte naturel, au lieu de s’appuyer sur des approches basées sur des règles. La correction ou l’incorrection grammaticale d’une phrase ne correspond pas nécessairement à la validité de la phrase. Il peut y avoir des phrases grammaticalement correctes mais sans sens, et des phrases grammaticalement incorrectes mais qui ont un sens. Pour distinguer les aspects les plus significatifs des mots, la CNL applique diverses techniques destinées à saisir le sens d’un groupe de mots avec moins de dépendance à la structure grammaticale et aux règles.
La CNL est un domaine en évolution et en constante mutation, et il est considéré comme l’un des problèmes les plus difficiles de l’IA. Diverses techniques et outils sont développés pour donner aux machines une compréhension du langage humain. La plupart des systèmes de CNL ont des composants de base communs. Un lexique pour la langue est requis, ainsi qu’un type d’analyseur de texte et des règles grammaticales pour guider la création de représentations de texte. Le système nécessite également une théorie des sémantiques pour permettre la compréhension des représentations. Il existe diverses théories sémantiques utilisées pour interpréter le langage, comme l’analyse sémantique stochastique ou la sémantique naive.
Les techniques de CNL courantes incluent :
La reconnaissance d’entités nommées est le processus de reconnaissance des « entités nommées », qui sont des personnes, des lieux et des choses importantes. La reconnaissance d’entités nommées fonctionne en distinguant les concepts fondamentaux et les références dans un corps de texte, en identifiant les entités nommées et en les plaçant dans des catégories comme les emplacements, les dates, les organisations, les personnes, les œuvres, etc. Les modèles supervisés basés sur les règles grammaticales sont généralement utilisés pour effectuer les tâches de reconnaissance d’entités nommées.
La disambiguation lexicale est le processus de détermination du sens, ou de la signification, d’un mot en fonction du contexte dans lequel le mot apparaît. La disambiguation lexicale utilise souvent des étiqueteurs de parties du discours pour contextualiser le mot cible. Les méthodes supervisées de disambiguation lexicale incluent l’utilisation de machines à vecteurs de support et d’apprentissage basé sur la mémoire. Cependant, la plupart des modèles de disambiguation lexicale sont des modèles semi-supervisés qui utilisent à la fois des données étiquetées et non étiquetées.
Exemples de CNL (Compréhension du Langage Naturel)
Les exemples courants de CNL incluent la raisonnement automatisé, le routage automatique des tickets, la traduction automatique et la réponse aux questions.
Raisonnement automatisé
Le raisonnement automatisé est une discipline qui vise à donner aux machines un type de logique ou de raisonnement. C’est une branche de la science cognitive qui cherche à faire des déductions basées sur des diagnostics médicaux ou à résoudre automatiquement des théorèmes mathématiques. La CNL est utilisée pour aider à collecter et à analyser les informations et à générer des conclusions basées sur les informations.
Routage automatique des tickets
La CNL est souvent utilisée pour automatiser les tâches de service client. Lorsqu’un ticket de service client est généré, les chatbots et les autres machines peuvent interpréter la nature de base du besoin du client et le diriger vers le département approprié. Les entreprises reçoivent des milliers de demandes de support chaque jour, donc les algorithmes de CNL sont utiles pour prioriser les tickets et permettre aux agents de support de les gérer de manière plus efficace.
Traduction automatique
Il est difficile de traduire avec précision le langage parlé ou écrit d’une langue à une autre. En fait, la traduction automatique est l’un des problèmes les plus difficiles de la TAL et de la CNL. De nombreux systèmes de traduction automatique s’appuient sur des règles linguistiques pour traduire entre les langues, mais les chercheurs cherchent des moyens plus sophistiqués de traduire entre les langues. La traduction automatique de la CNL tente de permettre une traduction plus précise en préservant le contexte et les informations sémantiques associées au texte cible. Les systèmes de traduction automatique les plus précis combinent les règles linguistiques avec des algorithmes qui extraient la signification sémantique.
Réponse aux questions
La reconnaissance de la parole utilise les techniques de CNL pour permettre aux ordinateurs de comprendre les questions posées avec un langage naturel. La CNL est utilisée pour donner aux utilisateurs de l’appareil une réponse dans leur langage naturel, au lieu de leur fournir une liste de réponses possibles. Lorsque vous posez une question à un assistant numérique, la CNL est utilisée pour aider les machines à comprendre les questions, en sélectionnant les réponses les plus appropriées en fonction de fonctionnalités telles que les entités reconnues et le contexte des déclarations précédentes.












