AI 101
Qu'est-ce que l'apprentissage par machine?
L’apprentissage automatique est l’un des domaines technologiques à la croissance la plus rapide, mais malgré la fréquence à laquelle les mots « apprentissage automatique » sont utilisés, il peut être difficile de comprendre ce qu’est précisément l’apprentissage automatique.
Apprentissage automatique « Le machine learning » ne désigne pas une seule chose, mais un terme générique qui peut s'appliquer à de nombreux concepts et techniques. Comprendre l'apprentissage automatique implique de se familiariser avec différentes formes d'analyse de modèles, de variables et d'algorithmes. Examinons de plus près l'apprentissage automatique pour mieux comprendre ce qu'il englobe.
Qu'est-ce que l'apprentissage automatique ?
Bien que le terme apprentissage automatique puisse s'appliquer à de nombreuses choses différentes, en général, le terme désigne le fait de permettre à un ordinateur d'effectuer des tâches sans recevoir d'instructions explicites ligne par ligne pour le faire. Un spécialiste de l'apprentissage automatique n'a pas à écrire toutes les étapes nécessaires pour résoudre le problème, car l'ordinateur est capable d'« apprendre » en analysant des modèles dans les données et en généralisant ces modèles à de nouvelles données.
Les systèmes d'apprentissage automatique comportent trois éléments de base :
- Contributions
- Algorithmes
- Sortie
Les entrées sont les données qui sont introduites dans le système d'apprentissage automatique, et les données d'entrée peuvent être divisées en étiquettes et fonctionnalités. Les caractéristiques sont les variables pertinentes, les variables qui seront analysées pour apprendre des modèles et tirer des conclusions. Pendant ce temps, les étiquettes sont des classes/descriptions données aux instances individuelles des données.
Les fonctionnalités et les étiquettes peuvent être utilisées dans deux types différents de problèmes d’apprentissage automatique : l’apprentissage supervisé et l’apprentissage non supervisé.
Apprentissage non supervisé ou supervisé
In enseignement supervisé, les données d'entrée sont accompagnées d'une vérité terrain. Les problèmes d'apprentissage supervisé ont les valeurs de sortie correctes dans le cadre de l'ensemble de données, de sorte que les classes attendues sont connues à l'avance. Cela permet au scientifique des données de vérifier les performances de l'algorithme en testant les données sur un ensemble de données de test et en voyant quel pourcentage d'éléments ont été correctement classés.
En revanche, apprentissage non supervisé les problèmes ne sont pas associés à des étiquettes de vérité terrain. Un algorithme d'apprentissage automatique formé pour effectuer des tâches d'apprentissage non supervisé doit être capable de déduire lui-même les modèles pertinents dans les données.
Les algorithmes d'apprentissage supervisé sont généralement utilisés pour les problèmes de classification, où l'on dispose d'un grand ensemble de données rempli d'instances qui doivent être triées dans l'une des nombreuses classes différentes. Un autre type d'apprentissage supervisé est une tâche de régression, où la valeur produite par l'algorithme est de nature continue au lieu d'être catégorique.
Pendant ce temps, des algorithmes d'apprentissage non supervisés sont utilisés pour des tâches telles que l'estimation de la densité, le regroupement et l'apprentissage des représentations. Ces trois tâches ont besoin du modèle d'apprentissage automatique pour déduire la structure des données, il n'y a pas de classes prédéfinies données au modèle.
Examinons brièvement certains des algorithmes les plus couramment utilisés dans l'apprentissage non supervisé et l'apprentissage supervisé.
Types d'apprentissage supervisé
Les algorithmes d'apprentissage supervisés courants incluent :
- NaĂŻf Bayes
- Machines Ă vecteurs de support
- Régression logistique
- Forêts aléatoires
- Réseaux neuronaux artificiels
Machines à vecteurs de support sont des algorithmes qui divisent un ensemble de données en différentes classes. Les points de données sont regroupés en clusters en traçant des lignes qui séparent les classes les unes des autres. Les points trouvés d'un côté de la ligne appartiendront à une classe, tandis que les points de l'autre côté de la ligne seront d'une classe différente. Les machines à vecteurs de support visent à maximiser la distance entre la ligne et les points trouvés de chaque côté de la ligne, et plus la distance est grande, plus le classificateur est convaincu que le point appartient à une classe et non à une autre classe.
Régression logistique est un algorithme utilisé dans les tâches de classification binaire lorsque des points de données doivent être classés comme appartenant à l'une des deux classes. La régression logistique fonctionne en étiquetant le point de données soit 1 soit 0. Si la valeur perçue du point de données est de 0.49 ou moins, il est classé comme 0, tandis que s'il est de 0.5 ou plus, il est classé comme 1.
Algorithmes d'arbre de décision fonctionnent en divisant les ensembles de données en fragments de plus en plus petits. Les critères exacts utilisés pour diviser les données dépendent de l'ingénieur en apprentissage automatique, mais l'objectif est finalement de diviser les données en points de données uniques, qui seront ensuite classés à l'aide d'une clé.
Un algorithme de forêt aléatoire est essentiellement constitué de plusieurs classificateurs d'arbre de décision uniques reliés entre eux en un classificateur plus puissant.
Le classificateur bayésien naïf calcule la probabilité qu'un point de données donné se soit produit en fonction de la probabilité d'un événement antérieur. Il s'appuie sur le théorème de Bayes et classe les points de données en fonction de leur probabilité calculée. Lors de la mise en œuvre d'un classificateur bayésien naïf, on suppose que tous les prédicteurs ont la même influence sur le résultat de la classe.
An Réseau neuronal artificiel, ou perceptron multicouche, sont des algorithmes d'apprentissage automatique inspirés de la structure et du fonctionnement du cerveau humain. Les réseaux de neurones artificiels tirent leur nom du fait qu'ils sont constitués de nombreux nœuds/neurones reliés entre eux. Chaque neurone manipule les données avec une fonction mathématique. Dans les réseaux de neurones artificiels, il existe des couches d'entrée, des couches cachées et des couches de sortie.
La couche cachée du réseau neuronal est l'endroit où les données sont réellement interprétées et analysées pour les modèles. En d'autres termes, c'est là que l'algorithme apprend. Plus de neurones réunis forment des réseaux plus complexes capables d'apprendre des modèles plus complexes.
Types d'apprentissage non supervisé
Les algorithmes d'apprentissage non supervisé incluent :
- Regroupement des K-moyennes
- Codeurs automatiques
- Analyse des composants principaux
Le clustering K-means est une technique de classification non supervisée qui consiste à séparer des points de données en clusters ou groupes selon leurs caractéristiques. Le clustering K-means analyse les caractéristiques des points de données et distingue les modèles qui rendent les points de données d'un cluster de classe donné plus similaires entre eux qu'ils ne le sont avec les clusters contenant les autres points de données. Pour ce faire, on place les centres possibles du cluster, ou centroïdes, dans un graphique de données et on réaffecte la position du centroïde jusqu'à trouver une position qui minimise la distance entre le centroïde et les points appartenant à la classe de ce centroïde. Le chercheur peut spécifier le nombre de clusters souhaité.
Analyse des composants principaux est une technique qui réduit un grand nombre de caractéristiques/variables dans un espace de caractéristiques plus petit/moins de caractéristiques. Les "composantes principales" des points de données sont sélectionnées pour la préservation, tandis que les autres caractéristiques sont comprimées dans une représentation plus petite. La relation entre les potions de données d'origine est préservée, mais comme la complexité des points de données est plus simple, les données sont plus faciles à quantifier et à décrire.
Les auto-encodeurs sont des versions de réseaux de neurones applicables aux tâches d'apprentissage non supervisé. Ils sont capables de prendre des données libres et non étiquetées et de les transformer en données exploitables par un réseau de neurones, créant ainsi ses propres données d'apprentissage étiquetées. L'objectif d'un auto-encodeur est de convertir les données d'entrée et de les reconstruire aussi précisément que possible. Le réseau a donc pour objectif de déterminer les caractéristiques les plus importantes et de les extraire.












