Leaders d’opinion

L’essor de LLMOps Ă  l’Ăšre de l’IA

mm

Dans le paysage IT en constante évolution, MLOps—abréviation de Machine Learning Operations—est devenu l’arme secrète des organisations qui visent à transformer des données complexes en insights puissants et exploitables. MLOps est un ensemble de pratiques conçues pour rationaliser le cycle de vie de l’apprentissage automatique (ML) — aidant les data scientists, les équipes IT, les parties prenantes commerciales et les experts de domaine à collaborer pour construire, déployer et gérer des modèles ML de manière cohérente et fiable. Il est apparu pour répondre à des défis uniques de l’IA, tels que garantir la qualité des données et éviter les biais, et est devenu une approche standard pour gérer les modèles ML à travers les fonctions commerciales.

Avec l’émergence des grands modèles de langage (LLM), cependant, de nouveaux défis ont émergé. Les LLM nécessitent une puissance de calcul massive, une infrastructure avancée et des techniques comme l’ingénierie de prompt pour fonctionner efficacement. Ces complexités ont donné naissance à une évolution spécialisée de MLOps appelée LLMOps (Large Language Model Operations).

LLMOps se concentre sur l’optimisation du cycle de vie des LLM, de la formation et de l’ajustement fin à la mise en production, à la mise à l’échelle, à la surveillance et à la maintenance des modèles. Il vise à répondre aux exigences spécifiques des LLM tout en garantissant qu’ils fonctionnent efficacement dans les environnements de production. Cela inclut la gestion des coûts de calcul élevés, la mise à l’échelle de l’infrastructure pour supporter les grands modèles et la rationalisation des tâches comme l’ingénierie de prompt et l’ajustement fin.

Avec ce déplacement vers LLMOps, il est important que les dirigeants commerciaux et IT comprennent les principaux avantages de LLMOps et déterminent quel processus est le plus approprié à utiliser et quand.

Avantages clés de LLMOps

LLMOps s’appuie sur les fondements de MLOps, offrant des capacités améliorées dans plusieurs domaines clés. Les trois principales façons dont LLMOps offrent de plus grands avantages aux entreprises sont:

  • Démocratisation de l’IA – LLMOps rend le développement et le déploiement des LLM plus accessibles aux parties prenantes non techniques. Dans les flux de travail ML traditionnels, les data scientists gèrent principalement la construction de modèles, tandis que les ingénieurs se concentrent sur les pipelines et les opérations. LLMOps déplace ce paradigme en exploitant les modèles open source, les services propriétaires et les outils low-code/no-code. Ces outils simplifient la construction et la formation de modèles, permettant aux équipes commerciales, aux responsables de produits et aux ingénieurs de collaborer plus efficacement. Les utilisateurs non techniques peuvent maintenant expérimenter et déployer des LLM en utilisant des interfaces intuitives, réduisant la barrière technique à l’adoption de l’IA.
  • Déploiement de modèles plus rapide: LLMOps rationalise l’intégration des LLM avec les applications commerciales, permettant aux équipes de déployer des solutions alimentées par l’IA plus rapidement et de s’adapter aux exigences changeantes du marché. Par exemple, avec LLMOps, les entreprises peuvent rapidement ajuster les modèles pour refléter les commentaires des clients ou les mises à jour réglementaires sans cycles de réaménagement étendus. Cette agilité garantit que les organisations peuvent rester à la pointe des tendances du marché et maintenir un avantage concurrentiel.
  • Émergence de RAGs – De nombreux cas d’utilisation d’entreprises pour les LLM impliquent la récupération de données pertinentes à partir de sources externes plutôt que de se fier uniquement à des modèles pré-formés. LLMOps introduit des pipelines de génération assistée par récupération (RAG), qui combinent des modèles de récupération pour extraire des données à partir de bases de connaissances avec des LLM qui classent et résument les informations. Cette approche réduit les hallucinations et offre un moyen rentable d’exploiter les données d’entreprise. Contrairement aux flux de travail ML traditionnels, où la formation de modèles est l’objectif principal, LLMOps déplace l’attention vers la construction et la gestion de pipelines RAG comme fonction principale dans le cycle de vie de développement.

Importance de la compréhension des cas d’utilisation de LLMOps

Avec les avantages généraux de LLMOps, notamment la démocratisation des outils d’IA à travers l’entreprise, il est important d’examiner les cas d’utilisation spécifiques où LLMOps peut être introduit pour aider les dirigeants commerciaux et les équipes IT à mieux exploiter les LLM:

  • Déploiement sécurisé de modèles– De nombreuses entreprises commencent leur développement de LLM avec des cas d’utilisation internes, notamment des bots de support client automatisés ou la génération et la révision de code pour acquérir confiance dans les performances des LLM avant de passer à des applications orientées client. Les cadres LLMOps aident les équipes à rationaliser un déploiement progressif de ces cas d’utilisation en 1) automatisant les pipelines de déploiement qui isolent les environnements internes des environnements orientés client, 2) en permettant des tests et une surveillance contrôlés dans des environnements de bac à sable pour identifier et résoudre les modes de défaillance, et 3) en prenant en charge les capacités de contrôle de version et de restauration pour que les équipes puissent itérer sur les déploiements internes avant de passer en ligne externe.
  • Gestion des risques de modèle – Les LLM seuls introduisent des préoccupations accrues en matière de gestion des risques de modèle, qui a toujours été un objectif critique pour MLOps. La transparence dans les données sur lesquelles les LLM sont formés est souvent floue, suscitant des inquiétudes quant à la vie privée, aux droits d’auteur et aux biais. Les hallucinations de données ont été un point de douleur énorme dans le développement de modèles. Cependant, avec LLMOps, ce défi est abordé. Les LLMOps sont capables de surveiller le comportement du modèle en temps réel, permettant aux équipes de 1) détecter et d’enregistrer les hallucinations à l’aide de raccourcis prédéfinis, 2) mettre en œuvre des boucles de rétroaction pour affiner continuellement les modèles en mettant à jour les invites ou en réformant avec des sorties corrigées, et 3) utiliser des métriques pour mieux comprendre et résoudre l’imprévisibilité générative.
  • Évaluation et surveillance des modèles– L’évaluation et la surveillance de LLM autonomes sont plus complexes que celles des modèles ML traditionnels. Contrairement aux modèles traditionnels, les applications LLM sont souvent spécifiques au contexte, nécessitant des entrées d’experts de domaine pour une évaluation efficace. Pour répondre à cette complexité, des cadres d’auto-évaluation ont émergé, où un LLM est utilisé pour évaluer un autre. Ces cadres créent des pipelines pour une évaluation continue, incorporant des tests automatisés ou des références gérées par les systèmes LLMOps. Cette approche suit les performances du modèle, signale les anomalies et améliore les critères d’évaluation, simplifiant le processus d’évaluation de la qualité et de la fiabilité des sorties génératives.

LLMOps fournit la colonne vertébrale opérationnelle pour gérer la complexité supplémentaire des LLM que MLOps ne peut pas gérer par lui-même. LLMOps garantit que les organisations peuvent résoudre des points de douleur tels que l’imprévisibilité des sorties génératives et l’émergence de nouveaux cadres d’évaluation, tout en permettant des déploiements sûrs et efficaces. Avec cela, il est essentiel que les entreprises comprennent ce déplacement de MLOps à LLMOps pour résoudre les défis uniques des LLM au sein de leur propre organisation et mettre en œuvre les opérations correctes pour garantir le succès de leurs projets d’IA.

Regarder vers l’avenir : adopter AgentOps

Maintenant que nous nous sommes plongés dans LLMOps, il est important de considérer ce qui se profile à l’horizon pour les cadres d’opérations à mesure que l’IA continue d’innover. Actuellement à la pointe de l’espace de l’IA, l’IA agente, ou les agents IA – qui sont des programmes entièrement automatisés dotés de capacités de raisonnement complexes et de mémoire qui utilisent un LLM pour résoudre des problèmes, créent leur propre plan pour le faire et exécutent ce plan. Deloitte prévoit que 25 % des entreprises utilisant l’IA générative sont susceptibles de déployer des agents IA en 2025, pour atteindre 50 % d’ici 2027. Ces données présentent un déplacement clair vers l’IA agente dans le futur – un déplacement qui a déjà commencé, car de nombreuses organisations ont déjà commencé à mettre en œuvre et à développer cette technologie.

Avec cela, AgentOps est la prochaine vague d’opérations d’IA que les entreprises devraient se préparer à adopter.

Les cadres AgentOps combinent des éléments d’IA, d’automatisation et d’opérations dans le but d’améliorer la manière dont les équipes gèrent et mettent à l’échelle les processus commerciaux. Il se concentre sur l’exploitation d’agents intelligents pour améliorer les flux de travail opérationnels, fournir des insights en temps réel et soutenir la prise de décision dans diverses industries. La mise en œuvre de cadres AgentOps améliore considérablement la cohérence du comportement et des réponses de l’agent IA aux situations inhabituelles, visant à minimiser les temps d’arrêt et les défaillances. Cela deviendra nécessaire à mesure que de plus en plus d’organisations commenceront à déployer et à utiliser des agents IA dans leurs flux de travail.

AgentOps est un composant essentiel pour gérer la prochaine génération de systèmes d’IA. Les organisations doivent se concentrer sur la garantie de l’observabilité, de la traçabilité et d’une surveillance améliorée pour développer des agents IA innovants et visionnaires. À mesure que l’automatisation progresse et que les responsabilités de l’IA augmentent, l’intégration efficace d’AgentOps est essentielle pour que les organisations maintiennent la confiance dans l’IA et mettent à l’échelle des opérations spécialisées et complexes.

Cependant, avant que les entreprises puissent commencer à travailler avec AgentOps, elles doivent avoir une compréhension claire de LLMOps – telle que décrite ci-dessus – et de la manière dont les deux opérations fonctionnent main dans la main. Sans une éducation appropriée sur LLMOps, les entreprises ne pourront pas construire efficacement sur le cadre existant lorsqu’elles travaillent à la mise en œuvre d’AgentOps.

En tant que directeur de la stratĂ©gie, Abhas dirige la stratĂ©gie d'entreprise globale pour Cloudera et est responsable de la crĂ©ation de la vision de l'entreprise, de la construction du modĂšle d'exploitation cible des entreprises et des clients, de la communication avec les parties prenantes clĂ©s et de la mise en Ɠuvre d'initiatives de transformation clĂ©s.