IA 101
Qu’est-ce que les rĂ©seaux de neurones ?

Qu’est-ce que les réseaux de neurones artificiels (ANN) ?
Beaucoup des plus grandes avancées de l’IA sont driven par les réseaux de neurones artificiels. Les réseaux de neurones artificiels (ANN) sont la connexion de fonctions mathématiques jointes ensemble dans un format inspiré par les réseaux de neurones trouvés dans le cerveau humain. Ces ANN sont capables d’extraire des modèles complexes à partir de données, d’appliquer ces modèles à des données non vues pour les classer/reconnaître. De cette façon, la machine « apprend ». C’est un aperçu rapide des réseaux de neurones, mais regardons de plus près les réseaux de neurones pour mieux comprendre ce qu’ils sont et comment ils fonctionnent.
Multi-layer Perceptron Expliqué
Avant de regarder des réseaux de neurones plus complexes, nous allons prendre un moment pour regarder une version simple d’ANN, un Multi-Layer Perceptron (MLP).

Imaginez une chaîne de montage dans une usine. Sur cette chaîne de montage, un ouvrier reçoit un article, fait quelques ajustements, puis le passe à l’ouvrier suivant dans la ligne qui fait de même. Ce processus se poursuit jusqu’à ce que le dernier ouvrier de la ligne mette les touches finales à l’article et le place sur un tapis roulant qui l’emportera hors de l’usine. Dans cette analogie, il y a plusieurs « couches » à la chaîne de montage, et les produits se déplacent entre les couches à mesure qu’ils passent d’un ouvrier à l’autre. La chaîne de montage a également un point d’entrée et un point de sortie.
Un Multi-Layer Perceptron peut être considéré comme une chaîne de production très simple, composée de trois couches au total : une couche d’entrée, une couche cachée et une couche de sortie. La couche d’entrée est où les données sont alimentées dans le MLP, et dans la couche cachée, un certain nombre de « travailleurs » gèrent les données avant de les passer à la couche de sortie qui donne le produit au monde extérieur. Dans le cas d’un MLP, ces travailleurs sont appelés « neurones » (ou parfois nœuds) et lorsqu’ils gèrent les données, ils les manipulent à l’aide d’une série de fonctions mathématiques.
A l’intérieur du réseau, il y a des structures reliant les nœuds appelées « poids ». Les poids sont une hypothèse sur la façon dont les points de données sont liés lorsqu’ils se déplacent dans le réseau. Pour le dire autrement, les poids reflètent le niveau d’influence qu’un neurone a sur un autre neurone. Les poids passent par une « fonction d’activation » lorsqu’ils quittent le nœud actuel, qui est un type de fonction mathématique qui transforme les données. Ils transforment les données linéaires en représentations non linéaires, ce qui permet au réseau d’analyser des modèles complexes.
L’analogie avec le cerveau humain impliquée par « réseau de neurones artificiel » vient du fait que les neurones qui composent le cerveau humain sont joints de la même manière que les nœuds dans un ANN sont liés.
Les multi-layer perceptrons existent depuis les années 1940, mais il y avait un certain nombre de limitations qui les empêchaient d’être très utiles. Cependant, au cours des dernières décennies, une technique appelée « backpropagation » a été créée, qui permet aux réseaux d’ajuster les poids des neurones et donc d’apprendre beaucoup plus efficacement. La backpropagation modifie les poids dans le réseau de neurones, permettant au réseau de mieux capturer les modèles réels dans les données.
Réseaux de neurones profonds
Les réseaux de neurones profonds prennent la forme de base du MLP et la rendent plus grande en ajoutant plus de couches cachées au milieu du modèle. Au lieu d’avoir une couche d’entrée, une couche cachée et une couche de sortie, il y a de nombreuses couches cachées au milieu et les sorties d’une couche cachée deviennent les entrées de la couche cachée suivante jusqu’à ce que les données aient traversé tout le réseau et soient retournées.
Les multiples couches cachées d’un réseau de neurones profond sont capables d’interpréter des modèles plus complexes que le multilayer perceptron traditionnel. Les différentes couches du réseau de neurones profond apprennent les modèles de différentes parties des données. Par exemple, si les données d’entrée consistent en des images, la première partie du réseau pourrait interpréter la luminosité ou l’obscurité des pixels, tandis que les couches plus tardives identifieront les formes et les bords qui peuvent être utilisés pour reconnaître les objets dans l’image.
Différents types de réseaux de neurones

Il existe différents types de réseaux de neurones, et chaque type de réseau de neurones a ses propres avantages et inconvénients (et donc ses propres cas d’utilisation). Le type de réseau de neurones profond décrit ci-dessus est le type de réseau de neurones le plus courant, et il est souvent appelé réseau de neurones feedforward.
Une variante des réseaux de neurones est le Réseau de Neurones Récurrent (RNN). Dans le cas des RNN, des mécanismes de bouclage sont utilisés pour conserver les informations des états précédents de l’analyse, ce qui signifie qu’ils peuvent interpréter des données où l’ordre est important. Les RNN sont utiles pour dériver des modèles à partir de données séquentielles/chronologiques. Les RNN peuvent être unidirectionnels ou bidirectionnels. Dans le cas d’un RNN bidirectionnel, le réseau peut prendre en compte les informations plus tard dans la séquence ainsi que les parties précédentes de la séquence. Puisque le RNN bidirectionnel prend en compte plus d’informations, il est mieux à même de tirer les bons modèles des données.
Un Réseau de Neurones Convolutionnel est un type spécial de réseau de neurones qui est habile à interpréter les modèles trouvés dans les images. Un CNN fonctionne en passant un filtre sur les pixels de l’image et en obtenant une représentation numérique des pixels dans l’image, qu’il peut ensuite analyser pour les modèles. Un CNN est structuré de telle sorte que les couches convolutionnelles qui extraient les pixels de l’image viennent en premier, et que les couches feedforward densément connectées qui apprennent vraiment à reconnaître les objets viennent après.












