Intelligence artificielle
Qu’est-ce que le NLP (Natural Language Processing) ?
Le traitement automatique des langues (NLP) est l’étude et l’application de techniques et d’outils qui permettent aux ordinateurs de traiter, d’analyser, d’interpréter et de raisonner sur le langage humain. Le NLP est un domaine interdisciplinaire qui combine des techniques établies dans des domaines comme la linguistique et l’informatique. Ces techniques sont utilisées en concert avec l’IA pour créer des chatbots et des assistants numériques comme Google Assistant et Amazon’s Alexa.
Commençons par explorer les raisons behind le traitement automatique des langues, certaines des techniques utilisées dans le NLP et certains cas d’utilisation courants pour le NLP.
Pourquoi le traitement automatique des langues (NLP) est important
Pour que les ordinateurs interprètent le langage humain, ils doivent être convertis en une forme que l’ordinateur peut manipuler. Cependant, ce n’est pas aussi simple que de convertir les données textuelles en nombres. Pour dériver le sens du langage humain, des modèles doivent être extraits des centaines ou des milliers de mots qui composent un document texte. Ce n’est pas une tâche facile. Il y a peu de règles strictes qui peuvent être appliquées à l’interprétation du langage humain. Par exemple, le même ensemble de mots peut signifier des choses différentes en fonction du contexte. Le langage humain est une chose complexe et souvent ambiguë, et une déclaration peut être prononcée avec sincérité ou sarcasme.
Malgré cela, il existe certaines directives générales qui peuvent être utilisées lors de l’interprétation des mots et des caractères, comme le caractère « s » étant utilisé pour indiquer qu’un élément est pluriel. Ces directives générales doivent être utilisées en concert les unes avec les autres pour extraire le sens du texte, pour créer des fonctionnalités que l’algorithme d’apprentissage automatique peut interpréter.
Le traitement automatique des langues implique l’application de divers algorithmes capables de prendre des données non structurées et de les convertir en données structurées. Si ces algorithmes sont appliqués de la mauvaise manière, l’ordinateur échouera souvent à dériver le sens correct du texte. Cela peut souvent être vu dans la traduction de texte entre les langues, où le sens précis de la phrase est souvent perdu. Même si la traduction automatique a considérablement amélioré ces dernières années, les erreurs de traduction automatique se produisent encore fréquemment.
Techniques de traitement automatique des langues (NLP)

Photo : Tamur via WikiMedia Commons, Domaine public (https://commons.wikimedia.org/wiki/File:ParseTree.svg)
De nombreuses techniques utilisées dans le traitement automatique des langues peuvent être classées en deux catégories : la syntaxe ou la sémantique. Les techniques de syntaxe sont celles qui traitent de l’ordre des mots, tandis que les techniques sémantiques sont les techniques qui impliquent le sens des mots.
Techniques de syntaxe NLP










