Suivez nous sur

La boucle de rĂ©troaction de l'IA : Maintenir la qualitĂ© de la production de modèles Ă  l'ère du contenu gĂ©nĂ©rĂ© par l'IA

Intelligence Artificielle

La boucle de rĂ©troaction de l'IA : Maintenir la qualitĂ© de la production de modèles Ă  l'ère du contenu gĂ©nĂ©rĂ© par l'IA

mm
La boucle de rĂ©troaction de l'IA : Maintenir la qualitĂ© de la production de modèles Ă  l'ère du contenu gĂ©nĂ©rĂ© par l'IA

Les modèles d'IA déployés en production nécessitent un mécanisme d'évaluation des performances robuste et continu. C'est là qu'une boucle de rétroaction IA peut être appliquée pour assurer des performances cohérentes du modèle.

Prenez-le d'Elon Musk:

"Je pense qu'il est très important d'avoir une boucle de rétroaction dans laquelle vous réfléchissez constamment à ce que vous avez fait et à la façon dont vous pourriez le faire mieux."

Pour tous les modèles d'IA, la procédure standard consiste à déployer le modèle, puis à le réentraîner périodiquement sur les données réelles les plus récentes afin de garantir que ses performances ne se dégradent pas. Mais avec l'essor fulgurant de IA générative, la formation de modèles d'IA est devenue anormale et sujette aux erreurs. En effet, les sources de données en ligne (Internet) deviennent progressivement un mélange de données générées par l'homme et générées par l'IA.

Par exemple, de nombreux blogs présentent aujourd'hui du texte généré par l'IA alimenté par LLM (Large Language Modules) comme ChatGPT ou GPT-4. De nombreuses sources de données contiennent des images générées par l'IA créées à l'aide de DALL-E2 ou Midjourney. De plus, les chercheurs en IA utilisent des données synthétiques générées à l’aide de Generative AI dans leurs pipelines de formation de modèles.

Par conséquent, nous avons besoin d'un mécanisme robuste pour garantir la qualité des modèles d'IA. C'est là que le besoin de boucles de rétroaction d'IA est devenu plus amplifié.

Qu'est-ce qu'une boucle de rĂ©troaction IA ?

Une boucle de rétroaction d'IA est un processus itératif où les décisions et les résultats d'un modèle d'IA sont collectés en continu et utilisés pour améliorer ou reformer ce même modèle, ce qui entraîne un apprentissage, un développement et une amélioration continus du modèle. Au cours de ce processus, les données d'entraînement, les paramètres du modèle et les algorithmes du système d'IA sont mis à jour et améliorés en fonction des données générées par le système.

Il existe principalement deux types de boucles de rĂ©troaction IA :

  1. Boucles de rĂ©troaction IA positive : Lorsque les modèles d'IA gĂ©nèrent des rĂ©sultats prĂ©cis qui correspondent aux attentes et aux prĂ©fĂ©rences des utilisateurs, les utilisateurs donnent des commentaires positifs via une boucle de rĂ©troaction, ce qui en retour renforce la prĂ©cision des rĂ©sultats futurs. Une telle boucle de rĂ©troaction est dite positive.
  2. Boucles de rĂ©troaction nĂ©gatives de l'IA : Lorsque les modèles d'IA gĂ©nèrent des rĂ©sultats inexacts, les utilisateurs signalent des dĂ©fauts via une boucle de rĂ©troaction qui, en retour, tente d'amĂ©liorer la stabilitĂ© du système en corrigeant les dĂ©fauts. Une telle boucle de rĂ©troaction est dite nĂ©gative.

Les deux types de boucles de rétroaction d'IA permettent le développement continu de modèles et l'amélioration des performances au fil du temps. Et ils ne sont pas utilisés ou appliqués isolément. Ensemble, ils aident les modèles d'IA déployés en production à savoir ce qui est bien ou mal.

Étapes des boucles de rétroaction de l'IA

Une illustration des données générées par l'IA dans la boucle de rétroaction de l'IA

Une illustration de haut niveau du mécanisme de rétroaction dans les modèles d'IA. Source

Comprendre le fonctionnement des boucles de rétroaction de l'IA est essentiel pour exploiter pleinement le potentiel de développement de l'IA. Explorons ci-dessous les différentes étapes des boucles de rétroaction de l'IA.

  1. Collecte de commentaires : Recueillir les rĂ©sultats pertinents du modèle pour l'Ă©valuation. En règle gĂ©nĂ©rale, les utilisateurs donnent leur avis sur le rĂ©sultat du modèle, qui est ensuite utilisĂ© pour le recyclage. Ou il peut s'agir de donnĂ©es externes du Web organisĂ©es pour affiner les performances du système.
  2. Re-formation du modèle : Ă€ l'aide des informations recueillies, le système d'IA est rĂ©entrainĂ© pour faire de meilleures prĂ©dictions, fournir des rĂ©ponses ou effectuer des activitĂ©s particulières en affinant les paramètres ou les pondĂ©rations du modèle.
  3. IntĂ©gration et test des commentaires : Après le recyclage, le modèle est testĂ© et Ă©valuĂ© Ă  nouveau. Ă€ ce stade, les commentaires des experts en la matière (PME) sont Ă©galement inclus pour mettre en Ă©vidence les problèmes au-delĂ  des donnĂ©es.
  4. Déploiement: Le modèle est redéployé après vérification des modifications. À ce stade, le modèle devrait signaler de meilleures performances sur les nouvelles données du monde réel, ce qui se traduirait par une expérience utilisateur améliorée.
  5. Surveillance: Le modèle est surveillé en permanence à l'aide de métriques pour identifier une détérioration potentielle, comme la dérive. Et le cycle de rétroaction continue.

Les problèmes des données de production et de la sortie du modèle d'IA

La construction de systèmes d'IA robustes nĂ©cessite une comprĂ©hension approfondie des problèmes potentiels liĂ©s aux donnĂ©es de production (donnĂ©es du monde rĂ©el) et aux rĂ©sultats des modèles. Examinons quelques problèmes qui deviennent un obstacle pour garantir la prĂ©cision et la fiabilitĂ© des systèmes d'IA :

  1. DĂ©rive des donnĂ©es : Se produit lorsque le modèle commence Ă  recevoir des donnĂ©es du monde rĂ©el provenant d'une distribution diffĂ©rente de celle de la distribution des donnĂ©es d'entraĂ®nement du modèle.
  2. DĂ©rive du modèle : Les capacitĂ©s prĂ©dictives et l'efficacitĂ© du modèle diminuent avec le temps en raison de l'Ă©volution des environnements rĂ©els. C'est ce qu'on appelle la dĂ©rive du modèle.
  3. Sortie du modèle d'IA par rapport Ă  la dĂ©cision dans le monde rĂ©el : Les modèles d'IA produisent des rĂ©sultats inexacts qui ne correspondent pas aux dĂ©cisions rĂ©elles des parties prenantes.
  4. Parti pris et Ă©quitĂ© : Les modèles d'IA peuvent dĂ©velopper des problèmes de biais et d'Ă©quitĂ©. Par exemple, dans un ConfĂ©rence TED par Janelle Shane, elle dĂ©crit la dĂ©cision d'Amazon d'arrĂŞter de travailler sur un algorithme de tri des CV en raison de la discrimination sexuelle.

Une fois que les modèles d'IA commencent à s'entraîner sur le contenu généré par l'IA, ces problèmes peuvent encore s'aggraver. Comment? Discutons-en plus en détail.

Boucles de rétroaction de l'IA à l'ère du contenu généré par l'IA

Dans le sillage de l'adoption rapide de l'IA gĂ©nĂ©rative, les chercheurs ont Ă©tudiĂ© un phĂ©nomène connu sous le nom de Effondrement du modèle. Ils dĂ©finissent l'effondrement du modèle comme :

"Processus dĂ©gĂ©nĂ©ratif affectant des gĂ©nĂ©rations de modèles gĂ©nĂ©ratifs appris, oĂą les donnĂ©es gĂ©nĂ©rĂ©es finissent par polluer l'ensemble d'apprentissage de la prochaine gĂ©nĂ©ration de modèles ; formĂ©s sur des donnĂ©es polluĂ©es, ils perçoivent alors mal la rĂ©alitĂ©.

Model Collapse se compose de deux cas particuliers,

  • Premier effondrement du modèle se produit lorsque "le modèle commence Ă  perdre des informations sur les queues de la distribution", c'est-Ă -dire les extrĂ©mitĂ©s de la distribution des donnĂ©es d'apprentissage.
  • Effondrement tardif du modèle se produit lorsque le "modèle enchevĂŞtre diffĂ©rents modes des distributions d'origine et converge vers une distribution qui ressemble un peu Ă  celle d'origine, souvent avec une très petite variance".

Causes de l'effondrement du modèle

Pour que les praticiens de l'IA puissent rĂ©soudre ce problème, il est essentiel de comprendre les raisons de l'effondrement du modèle, regroupĂ©es en deux catĂ©gories principales :

  1. Erreur d'approximation statistique : Il s'agit de la principale erreur causĂ©e par le nombre fini d'Ă©chantillons, et elle disparaĂ®t lorsque le nombre d'Ă©chantillons se rapproche de l'infini.
  2. Erreur d'approximation fonctionnelle : Cette erreur survient lorsque les modèles, tels que les rĂ©seaux de neurones, ne parviennent pas Ă  capturer la vĂ©ritable fonction sous-jacente qui doit ĂŞtre apprise Ă  partir des donnĂ©es.
Causes de l'effondrement du modèle - Exemple

Un échantillon de résultats de modèles pour plusieurs générations de modèles affectées par l'effondrement du modèle. Source

Comment la boucle de rétroaction de l'IA est affectée en raison du contenu généré par l'IA

Lorsque les modèles d'IA s'entraĂ®nent sur du contenu gĂ©nĂ©rĂ© par l'IA, cela a un effet destructeur sur les boucles de rĂ©troaction de l'IA et peut causer de nombreux problèmes pour les modèles d'IA recyclĂ©s, tels que :

  • Effondrement du modèle : Comme expliquĂ© ci-dessus, l'effondrement du modèle est une possibilitĂ© probable si la boucle de rĂ©troaction de l'IA contient du contenu gĂ©nĂ©rĂ© par l'IA.
  • Oubli catastrophique : Un dĂ©fi typique de l'apprentissage continu est que le modèle oublie les Ă©chantillons prĂ©cĂ©dents lors de l'apprentissage de nouvelles informations. C'est ce qu'on appelle l'oubli catastrophique.
  • Pollution des donnĂ©es: Il s'agit d'introduire des donnĂ©es synthĂ©tiques manipulatrices dans le modèle d'IA pour compromettre les performances, ce qui l'incite Ă  produire une sortie inexacte.

Comment les entreprises peuvent-elles crĂ©er une boucle de rĂ©troaction robuste pour leurs modèles d'IA ?

Les entreprises peuvent tirer profit de l'utilisation de boucles de rétroaction dans leurs workflows d'IA. Suivez les trois étapes principales ci-dessous pour améliorer les performances de vos modèles d'IA.

  • Commentaires d'experts en la matière : Les PME connaissent très bien leur domaine et comprennent l'utilisation des modèles d'IA. Ils peuvent offrir des informations pour augmenter l'alignement du modèle avec les paramètres du monde rĂ©el, ce qui augmente les chances d'obtenir des rĂ©sultats corrects. En outre, ils peuvent mieux gouverner et gĂ©rer les donnĂ©es gĂ©nĂ©rĂ©es par l'IA.
  • Choisissez des mĂ©triques de qualitĂ© de modèle pertinentes : Choisir la bonne mĂ©trique d'Ă©valuation pour la bonne tâche et surveiller le modèle en production sur la base de ces mĂ©triques peut garantir la qualitĂ© du modèle. Les praticiens de l'IA utilisent Ă©galement des outils MLOps pour l'Ă©valuation et la surveillance automatisĂ©es afin d'alerter toutes les parties prenantes si les performances du modèle commencent Ă  se dĂ©tĂ©riorer en production.
  • Conservation stricte des donnĂ©es : Au fur et Ă  mesure que les modèles de production sont recyclĂ©s sur de nouvelles donnĂ©es, ils peuvent oublier les informations passĂ©es, il est donc crucial de conserver des donnĂ©es de haute qualitĂ© qui correspondent bien Ă  l'objectif du modèle. Ces donnĂ©es peuvent ĂŞtre utilisĂ©es pour rĂ©entraĂ®ner le modèle dans les gĂ©nĂ©rations suivantes, ainsi que les commentaires des utilisateurs pour garantir la qualitĂ©.

Pour en savoir plus sur les avancées de l'IA, rendez-vous sur Unite.ai.

Haziqa est un Data Scientist avec une vaste expérience dans la rédaction de contenu technique pour les entreprises d'IA et de SaaS.