Modèles et plateformes d’IA

Apprentissage sur appareil tout au long de la vie plus proche avec une nouvelle technique d’entraînement

mm

Une équipe de chercheurs du MIT et du MIT-IBM Watson AI Lab a développé une nouvelle technique qui permet l’entraînement sur appareil en utilisant moins d’un quart de megaoctet de mémoire. Cette nouvelle avancée est un exploit impressionnant, car d’autres solutions d’entraînement nécessitent généralement plus de 500 megaoctets de mémoire, ce qui dépasse la capacité de 256 kilo-octets de la plupart des microcontrôleurs.

En entraînant un modèle d’apprentissage automatique sur un appareil intelligent de pointe, il peut s’adapter à de nouvelles données et faire de meilleures prévisions. Cela étant dit, le processus d’entraînement nécessite généralement beaucoup de mémoire, il est donc souvent effectué avec des ordinateurs dans un centre de données avant de déployer le modèle sur un appareil. Ce processus est beaucoup plus coûteux et soulève des préoccupations en matière de confidentialité par rapport à la nouvelle technique développée par l’équipe.

Les chercheurs ont développé les algorithmes et le cadre de manière à réduire la quantité de calcul nécessaire pour entraîner un modèle, ce qui rend le processus plus rapide et plus efficace en termes de mémoire. La technique peut aider à entraîner un modèle d’apprentissage automatique sur un microcontrôleur en quelques minutes seulement.

La nouvelle technique aide également à préserver la confidentialité, car elle garde les données sur l’appareil, ce qui est important lorsque des données sensibles sont impliquées. Dans le même temps, le cadre améliore la précision du modèle par rapport à d’autres approches.

Song Han est professeur agrégé au département de génie électrique et d’informatique (EECS), membre du MIT-IBM Watson AI Lab et auteur principal de l’article de recherche.

« Notre étude permet aux appareils IoT de ne pas seulement effectuer des inférences, mais également de mettre à jour en continu les modèles d’IA avec les nouvelles données collectées, ouvrant la voie à un apprentissage sur appareil tout au long de la vie », a déclaré Han. « L’utilisation des ressources réduites rend l’apprentissage profond plus accessible et peut avoir une portée plus large, en particulier pour les appareils de pointe à faible consommation. »

L’article publié comporte des co-auteurs principaux et des étudiants diplômés en doctorat Ji Lin et Ligeng Zhu, ainsi que des post-doctorants du MIT Wei-Ming Chen et Wei-Chen Wang. Il comprend également Chuang Gan, membre principal du personnel de recherche du MIT-IBM Watson AI Lab.

Améliorer l’efficacité du processus d’entraînement

Pour rendre le processus d’entraînement plus efficace et moins gourmand en mémoire, l’équipe s’est appuyée sur deux solutions algorithmiques. La première est connue sous le nom de mise à jour parcimonieuse, qui utilise un algorithme qui identifie les poids les plus importants à mettre à jour lors de chaque cycle d’entraînement. L’algorithme gèle les poids un à un jusqu’à ce que la précision atteigne un certain seuil, auquel point il s’arrête. Les poids restants sont ensuite mis à jour et les activations correspondant aux poids gelés n’ont pas besoin d’être stockées en mémoire.

« La mise à jour de l’ensemble du modèle est très coûteuse, car il y a beaucoup d’activations, donc les gens ont tendance à ne mettre à jour que la dernière couche, mais comme vous pouvez l’imaginer, cela nuit à la précision », a déclaré Han. « Pour notre méthode, nous mettons à jour de manière sélective les poids importants et nous nous assurons que la précision est entièrement préservée. »

La deuxième solution développée par l’équipe implique une formation quantifiée et une simplification des poids. Un algorithme arrondit d’abord les poids à seulement huit bits par le biais d’un processus de quantification qui réduit également la quantité de mémoire nécessaire à l’entraînement et à l’inférence, l’inférence étant le processus d’application d’un modèle à un ensemble de données et de génération d’une prédiction. L’algorithme s’appuie ensuite sur une technique appelée mise à l’échelle de la quantification (QAS), qui agit comme un multiplicateur pour ajuster le rapport entre le poids et le gradient. Cela aide à éviter toute perte de précision qui pourrait résulter d’une formation quantifiée.

Les chercheurs ont développé un système appelé moteur d’entraînement miniature, qui exécute les innovations algorithmiques sur un simple microcontrôleur sans système d’exploitation. Pour effectuer plus de travail à l’étape de compilation, avant le déploiement du modèle sur l’appareil de pointe, le système modifie l’ordre des étapes du processus d’entraînement.

« Nous poussons beaucoup de calcul, comme l’auto-différenciation et l’optimisation de graphique, à l’étape de compilation. Nous élaguons également agressivement les opérateurs redondants pour prendre en charge les mises à jour parcimonieuses. Une fois en temps d’exécution, nous avons beaucoup moins de travail à effectuer sur l’appareil », déclare Han.

Technique très efficace

Alors que les techniques traditionnelles conçues pour un entraînement léger nécessiteraient généralement autour de 300 à 600 megaoctets de mémoire, l’optimisation de l’équipe n’a nécessité que 157 kilo-octets pour entraîner un modèle d’apprentissage automatique sur un microcontrôleur.

Le cadre a été testé en entraînant un modèle de vision par ordinateur pour détecter les personnes dans les images, et il a appris à effectuer cette tâche en seulement 10 minutes. La méthode a également pu entraîner un modèle plus de 20 fois plus rapidement que d’autres méthodes.

Les chercheurs vont maintenant essayer d’appliquer les techniques à des modèles de langage et à différents types de données. Ils veulent également utiliser ces connaissances acquises pour réduire la taille des modèles plus importants sans perte de précision, ce qui pourrait également aider à réduire l’empreinte carbone de l’entraînement de grands modèles d’apprentissage automatique.

Alex McFarland est un journaliste et écrivain en intelligence artificielle qui explore les derniers développements en intelligence artificielle. Il a collaboré avec de nombreuses startups et publications en intelligence artificielle dans le monde entier.