Prompt engineering
Qu’est-ce que la sollicitation de chaîne de pensée (CoT) ? Exemples et avantages

Ces dernières années, les grands modèles de langage (LLM) ont fait des progrès remarquables dans leur capacité à comprendre et à générer du texte similaire à celui des humains. Ces modèles, tels que GPT d’OpenAI et Claude d’Anthropic, ont démontré des performances impressionnantes sur une large gamme de tâches de traitement du langage naturel. Cependant, lorsqu’il s’agit de tâches de raisonnement complexes qui nécessitent plusieurs étapes de pensée logique, les méthodes de sollicitation traditionnelles sont souvent insuffisantes. C’est là que la sollicitation de chaîne de pensée (CoT) intervient, offrant une technique puissante de conception de sollicitation pour améliorer les capacités de raisonnement des grands modèles de langage.
Points clés
- La sollicitation CoT améliore les capacités de raisonnement en générant des étapes intermédiaires.
- Elle divise les problèmes complexes en sous-problèmes plus petits et gérables.
- Les avantages incluent des performances améliorées, une interprétabilité et une généralisation accrues.
- La sollicitation CoT s’applique à la raison arithmétique, à la raison courante et à la raison symbolique.
- Elle a le potentiel d’avoir un impact significatif sur l’IA dans divers domaines.
Qu’est-ce que la sollicitation de chaîne de pensée (CoT) ?
La sollicitation de chaîne de pensée est une technique qui vise à améliorer les performances des grands modèles de langage sur les tâches de raisonnement complexes en encourageant le modèle à générer des étapes de raisonnement intermédiaires. Contrairement aux méthodes de sollicitation traditionnelles, qui fournissent généralement une sollicitation unique et attendent une réponse directe, la sollicitation CoT divise le processus de raisonnement en une série d’étapes plus petites et interconnectées.
Au cœur de la sollicitation CoT, il s’agit de solliciter le modèle de langage avec une question ou un problème, puis de le guider pour générer une chaîne de pensée – une séquence d’étapes de raisonnement intermédiaires qui mènent à la réponse finale. En modélisant explicitement le processus de raisonnement, la sollicitation CoT permet au modèle de langage de traiter les tâches de raisonnement complexes de manière plus efficace.
L’un des principaux avantages de la sollicitation CoT est qu’elle permet au modèle de langage de décomposer un problème complexe en sous-problèmes plus gérables. En générant des étapes de raisonnement intermédiaires, le modèle peut diviser la tâche de raisonnement globale en étapes plus petites et plus ciblées. Cette approche aide le modèle à maintenir la cohérence et réduit les chances de perdre le fil du processus de raisonnement.
La sollicitation CoT a montré des résultats prometteurs pour améliorer les performances des grands modèles de langage sur une variété de tâches de raisonnement complexes, notamment la raison arithmétique, la raison courante et la raison symbolique. En exploitant le pouvoir des étapes de raisonnement intermédiaires, la sollicitation CoT permet aux modèles de langage de faire preuve d’une compréhension plus approfondie du problème en question et de générer des réponses plus précises et plus cohérentes.

Standard vs sollicitation CoT (Wei et al., Google Research, Brain Team)
Comment fonctionne la sollicitation de chaîne de pensée
La sollicitation CoT fonctionne en générant une série d’étapes de raisonnement intermédiaires qui guident le modèle de langage à travers le processus de raisonnement. Au lieu de fournir simplement une sollicitation et d’attendre une réponse directe, la sollicitation CoT encourage le modèle à diviser le problème en étapes plus petites et plus gérables.
Le processus commence par présenter au modèle de langage une sollicitation qui décrit la tâche de raisonnement complexe en question. Cette sollicitation peut prendre la forme d’une question, d’un énoncé de problème ou d’un scénario qui nécessite une pensée logique. Une fois la sollicitation fournie, le modèle génère une séquence d’étapes de raisonnement intermédiaires qui mènent à la réponse finale.
Chaque étape de raisonnement intermédiaire dans la chaîne de pensée représente un petit sous-problème ciblé que le modèle doit résoudre. En générant ces étapes, le modèle peut aborder la tâche de raisonnement globale de manière plus structurée et systématique. Les étapes intermédiaires permettent au modèle de maintenir la cohérence et de suivre le processus de raisonnement, réduisant ainsi les chances de perdre le fil ou de générer des informations non pertinentes.
À mesure que le modèle progresse dans la chaîne de pensée, il se fonde sur les étapes de raisonnement précédentes pour arriver à la réponse finale. Chaque étape de la chaîne est connectée aux étapes précédentes et suivantes, formant un flux logique de raisonnement. Cette approche étape par étape permet au modèle de traiter les tâches de raisonnement complexes de manière plus efficace, car il peut se concentrer sur un sous-problème à la fois tout en maintenant le contexte global.
La génération d’étapes de raisonnement intermédiaires dans la sollicitation CoT est généralement réalisée à l’aide de sollicitations et de techniques de formation soigneusement conçues. Les chercheurs et les praticiens peuvent utiliser diverses méthodes pour encourager le modèle à produire une chaîne de pensée, telles que la fourniture d’exemples de raisonnement étape par étape, l’utilisation de jetons spéciaux pour indiquer le début et la fin de chaque étape de raisonnement, ou la mise à jour fine du modèle sur des ensembles de données qui démontrent le processus de raisonnement souhaité.

Processus de sollicitation CoT en 5 étapes
En guidant le modèle de langage à travers le processus de raisonnement à l’aide d’étapes intermédiaires, la sollicitation CoT permet au modèle de résoudre les tâches de raisonnement complexes de manière plus précise et plus efficace. La modélisation explicite du processus de raisonnement améliore également l’interprétabilité des sorties du modèle, car la chaîne de pensée générée fournit des informations sur la façon dont le modèle est arrivé à sa réponse finale.
Exemples de sollicitation de chaîne de pensée
La sollicitation CoT a été appliquée avec succès à une variété de tâches de raisonnement complexes, démontrant son efficacité pour améliorer les performances des grands modèles de langage.
Explorons quelques exemples de l’utilisation de la sollicitation CoT dans différents domaines.
Raisonnement arithmétique
L’une des applications les plus simples de la sollicitation CoT est dans les tâches de raisonnement arithmétique. En générant des étapes de raisonnement intermédiaires, la sollicitation CoT peut aider les modèles de langage à résoudre les problèmes arithmétiques à plusieurs étapes de manière plus précise.
Par exemple, considérons le problème suivant :
"Si Jean a 5 pommes et que Marie a 3 fois plus de pommes que Jean, combien de pommes Marie a-t-elle ?"
En utilisant la sollicitation CoT, le modèle de langage peut générer une chaîne de pensée comme suit :
Jean a 5 pommes.Marie a 3 fois plus de pommes que Jean.Pour trouver le nombre de pommes que Marie a, nous devons multiplier les pommes de Jean par 3.5 pommes × 3 = 15 pommesPar conséquent, Marie a 15 pommes.
En décomposant le problème en étapes plus petites, la sollicitation CoT permet au modèle de langage de raisonner à travers le problème arithmétique de manière plus efficace.
Raisonnement courant
La sollicitation CoT a également montré son potentiel pour traiter les tâches de raisonnement courant, qui nécessitent une compréhension approfondie des connaissances du monde réel et de la pensée logique.
Par exemple, considérons la question suivante :
"Si une personne est allergique aux chiens et que son ami l'invite chez lui, où il y a un chien, que devrait faire la personne ?"
Un modèle de langage utilisant la sollicitation CoT pourrait générer la chaîne de pensée suivante :
La personne est allergique aux chiens.La maison de l'ami a un chien.Être près des chiens peut déclencher les allergies de la personne.Pour éviter une réaction allergique, la personne devrait décliner l'invitation.La personne peut suggérer un lieu alternatif pour rencontrer son ami.
En générant des étapes de raisonnement intermédiaires, la sollicitation CoT permet au modèle de langage de démontrer une compréhension plus claire de la situation et de fournir une solution logique.
Raisonnement symbolique
La sollicitation CoT a également été appliquée aux tâches de raisonnement symbolique, qui impliquent la manipulation et le raisonnement avec des symboles et des concepts abstraits.
Par exemple, considérons le problème suivant :
"Si A implique B, et B implique C, A implique-t-il C ?"
En utilisant la sollicitation CoT, le modèle de langage peut générer une chaîne de pensée comme suit :
A implique B signifie que si A est vrai, alors B doit également être vrai.B implique C signifie que si B est vrai, alors C doit également être vrai.Si A est vrai, alors B est vrai (à partir de l'étape 1).Si B est vrai, alors C est vrai (à partir de l'étape 2).Par conséquent, si A est vrai, alors C doit également être vrai.Donc, A implique C.
En générant des étapes de raisonnement intermédiaires, la sollicitation CoT permet au modèle de langage de traiter les tâches de raisonnement symbolique de manière plus efficace.
Ces exemples démontrent la polyvalence et l’efficacité de la sollicitation CoT pour améliorer les performances des grands modèles de langage sur les tâches de raisonnement complexes dans différents domaines. En modélisant explicitement le processus de raisonnement à l’aide d’étapes intermédiaires, la sollicitation CoT améliore la capacité du modèle à traiter les problèmes difficiles et à générer des réponses plus précises et plus cohérentes.
Avantages de la sollicitation de chaîne de pensée
La sollicitation de chaîne de pensée offre plusieurs avantages significatifs pour améliorer les capacités de raisonnement des grands modèles de langage. Explorons quelques-uns des principaux avantages :
Amélioration des performances sur les tâches de raisonnement complexes
L’un des principaux avantages de la sollicitation CoT est sa capacité à améliorer les performances des modèles de langage sur les tâches de raisonnement complexes. En générant des étapes de raisonnement intermédiaires, la sollicitation CoT permet aux modèles de diviser les problèmes complexes en sous-problèmes plus gérables. Cette approche étape par étape permet au modèle de maintenir la cohérence et de suivre le processus de raisonnement, conduisant à des résultats plus précis et plus fiables.
Les études ont montré que les modèles de langage formés avec la sollicitation CoT surpassent régulièrement ceux formés avec des méthodes de sollicitation traditionnelles sur une large gamme de tâches de raisonnement complexes. La modélisation explicite du processus de raisonnement à l’aide d’étapes intermédiaires s’est avérée être une technique puissante pour améliorer la capacité du modèle à traiter les problèmes difficiles qui nécessitent une pensée logique à plusieurs étapes.
Amélioration de l’interprétabilité du processus de raisonnement
Un autre avantage significatif de la sollicitation CoT est l’amélioration de l’interprétabilité du processus de raisonnement. En générant une chaîne de pensée, le modèle de langage fournit une explication claire et transparente de la façon dont il est arrivé à sa réponse finale. Cette décomposition étape par étape du processus de raisonnement permet aux utilisateurs de comprendre le processus de pensée du modèle et d’évaluer la validité de ses conclusions.
L’interprétabilité offerte par la sollicitation CoT est particulièrement précieuse dans les domaines où le processus de raisonnement lui-même est d’intérêt, tels que les environnements éducatifs ou les systèmes qui nécessitent une explication de l’IA. En fournissant des informations sur le processus de raisonnement du modèle, la sollicitation CoT favorise la confiance et la responsabilité dans l’utilisation des grands modèles de langage.
Potentiel de généralisation à diverses tâches de raisonnement
La sollicitation CoT a démontré son potentiel pour se généraliser à une large gamme de tâches de raisonnement. Bien que la technique ait été appliquée avec succès à des domaines spécifiques comme le raisonnement arithmétique, le raisonnement courant et le raisonnement symbolique, les principes sous-jacents de la sollicitation CoT peuvent être étendus à d’autres types de tâches de raisonnement complexes.
La capacité à générer des étapes de raisonnement intermédiaires est une compétence fondamentale qui peut être exploitée dans différents domaines de problèmes. En mettant à jour fine les modèles de langage sur des ensembles de données qui démontrent le processus de raisonnement souhaité, la sollicitation CoT peut être adaptée pour traiter de nouvelles tâches de raisonnement, élargissant ainsi son applicabilité et son impact.
Facilitation du développement de systèmes d’IA plus capables
La sollicitation CoT joue un rôle crucial dans la facilitation du développement de systèmes d’IA plus capables et plus intelligents. En améliorant les capacités de raisonnement des grands modèles de langage, la sollicitation CoT contribue à la création de systèmes d’IA qui peuvent traiter les problèmes complexes et faire preuve de niveaux de compréhension plus élevés.
À mesure que les systèmes d’IA deviennent plus sophistiqués et sont déployés dans divers domaines, la capacité à effectuer des tâches de raisonnement complexes devient de plus en plus importante. La sollicitation CoT fournit un outil puissant pour améliorer les compétences en raisonnement de ces systèmes, leur permettant de traiter des problèmes plus difficiles et de prendre des décisions plus éclairées.
Résumé rapide
La sollicitation CoT est une technique puissante qui améliore les capacités de raisonnement des grands modèles de langage en générant des étapes de raisonnement intermédiaires. En décomposant les problèmes complexes en sous-problèmes plus gérables, la sollicitation CoT permet aux modèles de traiter les tâches de raisonnement complexes de manière plus efficace. Cette approche améliore les performances, renforce l’interprétabilité et facilite le développement de systèmes d’IA plus capables.
FAQ
Comment fonctionne la sollicitation de chaîne de pensée (CoT) ?
La sollicitation CoT fonctionne en générant une série d’étapes de raisonnement intermédiaires qui guident le modèle de langage à travers le processus de raisonnement, décomposant les problèmes complexes en sous-problèmes plus gérables.
Quels sont les avantages de l’utilisation de la sollicitation de chaîne de pensée ?
Les avantages de la sollicitation CoT incluent l’amélioration des performances sur les tâches de raisonnement complexes, l’amélioration de l’interprétabilité du processus de raisonnement, le potentiel de généralisation à diverses tâches de raisonnement et la facilitation du développement de systèmes d’IA plus capables.
Quels sont les exemples de tâches qui peuvent être améliorées avec la sollicitation de chaîne de pensée ?
Des exemples de tâches qui peuvent être améliorées avec la sollicitation CoT incluent le raisonnement arithmétique, le raisonnement courant, le raisonnement symbolique et d’autres tâches de raisonnement complexes qui nécessitent plusieurs étapes de pensée logique.












