Intelligence artificielle
Quantum Stat Crée un Référentiel NLP Colab

En janvier, nous avons couvert la sortie de la base de données « Big Bad NLP Database » de Quantum Stat, une base de données contenant des centaines de différents jeux de données pour que les développeurs de l’apprentissage automatique puissent les utiliser. C’était un grand développement pour le traitement automatique des langues (NLP), et l’entreprise a maintenant créé « The Super Duper NLP Repo ».

Référentiel NLP Colab de Quantum Stat
The Super Duper NLP Repo
Selon Ricky Costa, PDG de Quantum Stat, le besoin d’une nouvelle base de données est né de l’avancement de l’industrie du NLP. En raison de cela, Quantum Stat a cherché de nouvelles solutions et a donné aux développeurs un accès direct au code.
Ricky Costa a accordé une interview à Unite.AI qui peut être trouvée ici.
La base de données The Super Duper NLP Repo contient plus de 100 cahiers Colab, qui exécutent le code ML pour différentes tâches de NLP. Les cahiers Colab aident à diffuser divers modèles et offrent un moyen pour les développeurs d’expérimenter puisqu’ils fournissent un GPU/TPU gratuit sur les serveurs principaux de Google.
La disposition de la nouvelle base de données est similaire à la précédente et facile à suivre. Elle comprend le nom du cahier, la date à laquelle il a été ajouté, une description, un modèle, une tâche, le créateur et un lien pour l’ouvrir dans Colab.
Selon l’entreprise, les cahiers de la base de données proviennent à la fois de chercheurs en IA indépendants et de l’industrie. Certains des modèles inclus sont TensorFlow, Hugging Face et DeepPavlov.
Avec les cahiers, de nombreux modèles peuvent être exécutés, notamment BERT, TD, CNN et GPT-2. Il existe de nombreuses tâches telles que la classification, la génération de texte, les embeddings, le dialogue, l’analyse des sentiments et la traduction de la parole.
Selon un article de Ricky Costa sur Medium, « Nous avons continué avec la même mentalité communautaire pour avoir un lieu de destination où les développeurs peuvent contribuer leur propre code au domaine émergent du NLP. Si vous avez un cahier à partager, vous pouvez toujours appuyer sur le grand bouton rouge. »
Traitement automatique des langues
Le traitement automatique des langues traite des ordinateurs et des langues humaines. Des techniques et des outils sont utilisés pour permettre aux ordinateurs de traiter, d’interpréter et d’analyser le langage humain, et le domaine emprunte à d’autres domaines tels que la linguistique, l’informatique, l’ingénierie de l’information et l’intelligence artificielle.
Le langage humain doit d’abord être converti pour qu’il soit possible pour un ordinateur de le manipuler. Finalement, une machine sera capable de lire et de comprendre le langage humain, ainsi que d’en déduire le sens.
Le NLP progresse beaucoup grâce à l’accès aux données et à la puissance de calcul accrue. Certains des domaines qui utilisent le NLP incluent les soins de santé, la finance, les médias et les ressources humaines.
Il existe de nombreuses autres applications pour le NLP, telles que les chatbots, les assistants numériques, l’organisation de documents, l’analyse des sentiments et le recrutement de talents. Dans le cas des assistants numériques, tels que Alexa d’Amazon, le NLP est utilisé pour interpréter les commandes vocales et répondre en conséquence. Le véritable pouvoir réside dans le fait qu’il permet à l’utilisateur d’attribuer des tâches cognitives à la technologie, ce qui permet à l’individu de se concentrer sur d’autres domaines.
Lorsqu’il s’agit d’analyse des sentiments, les techniques de NLP aident à établir des liens entre l’utilisation du langage et les réactions et les sentiments des personnes. Les entreprises peuvent utiliser cela pour découvrir des choses comme la façon dont un produit est reçu par les utilisateurs.
The Super Duper NLP Repo de Quantum Stat aide à rassembler tout cela en un seul endroit. Les développeurs peuvent compter sur The Super Duper NLP Repo comme une opportunité d’explorer et d’expérimenter différents modèles, et il est formaté de manière très informative et facile à suivre. Peut-être que sa plus grande force réside dans le fait qu’il fournit également une plateforme pour les chercheurs en IA indépendants.










