RL RanceLee Tutorials
← Retour aux tutoriels

Pourquoi pousser un LLM plus fort peut réellement fonctionner

J’ai réfléchi à la façon d’utiliser l’IA pour un petit business annexe. J’ai essayé d’écrire un compte public WeChat, mais honnêtement, je n’arrivais même pas à rentabiliser mon abonnement mensuel à l’IA. J’ai aussi mis en place une structure pour un roman, mais je n’étais pas satisfait du premier chapitre. Puis je me suis dit : pourquoi ne pas essayer d’utiliser l’IA pour m’aider dans le trading d’actions ? Et cela m’a conduit à l’expérience d’aujourd’hui.

Soyons clairs : je ne dis pas que le trading d’actions avec l’IA fonctionne, et je ne recommande pas cette méthode. J’ai juste acheté Claude Max aujourd’hui et je voulais profiter du quota généreux pour construire un système complet assisté par l’IA, dont le graphique n’est qu’une partie. Quant à savoir si ce système peut réellement m’aider à gagner de l’argent avec les actions – si jamais je deviens riche, on reparlera de ce framework.

Mais je suis resté bloqué sur un bug : les extrémités des « traits » dans la Théorie de Chan devraient être précisément alignées avec les hauts et les bas des chandeliers, mais les graphiques dessinés par l’IA étaient toujours décalés.

Je lui ai demandé de corriger trois fois, et à chaque fois l’IA disait « corrigé », mais quand j’ouvrais le graphique, c’était toujours faux.

Puis je me suis souvenu d’une compétence appelée PUA que j’avais vue auparavant, même recommandée par Kashen. J’ai toujours pensé que c’était une blague – utiliser la « pression du travail en grande entreprise » pour faire du PUA à votre IA ? Ça semble ridicule.

Mais j’ai essayé quand même, en dernier recours.

Et ça a été corrigé du premier coup !


D’abord, regardons le résultat

Regardez d’abord le graphique avant la correction. Remarquez le décalage évident entre les extrémités des traits et les hauts/bas des chandeliers :

Après avoir utilisé la compétence PUA, l’IA a réanalysé le problème, et voici le résultat après la correction :

Les extrémités sont maintenant directement alignées avec les points les plus hauts et les plus bas des chandeliers. Ce que trois tentatives précédentes n’avaient pas réussi à accomplir, la compétence PUA l’a corrigé du premier coup.


Que s’est-il réellement passé ?

J’ai dit à l’IA dans la conversation :

Utilise la compétence PUA pour te motiver, puis vérifie ce qui ne va pas vraiment.

Ensuite, l’IA a chargé la compétence PUA, et son style a changé radicalement. Elle a d’abord choisi la « saveur Huawei » pour elle-même, puis a lancé une méthodologie appelée RCA 5-Why Root Cause Analysis.

En termes simples, elle demande « pourquoi » cinq fois de suite :

  1. Pourquoi les extrémités des traits n’étaient-elles pas alignées avec les hauts/bas des chandeliers ? → Les coordonnées dans le graphique ne correspondaient pas aux chandeliers d’origine.
  2. Pourquoi ne correspondaient-elles pas ? → Le code pour rechercher les points extrêmes ne regardait que dans une plage de ±3 chandeliers, mais le décalage réel pouvait être bien supérieur à 3.
  3. Pourquoi le décalage était-il si grand ? → Après la fusion des chandeliers, plusieurs chandeliers n’en forment plus qu’un, donc l’index était décalé.
  4. Pourquoi les trois corrections précédentes n’ont-elles pas fonctionné ? → Je modifiais sans cesse le code de traçage sans jamais vérifier si les données elles-mêmes étaient correctes.
  5. Quelle était la cause racine ? → Aucune validation des données, modification aveugle du code.

Après avoir trouvé la cause racine, l’approche de l’IA a complètement changé. Elle ne s’est pas précipitée pour modifier le code ; elle a d’abord affiché un ensemble de données – en comparant les coordonnées réelles des extrémités des traits avec les vrais hauts et bas des chandeliers d’origine :

up end: orig_idx=185, snap±3=188:4025, true_extreme±10=194:4179
→ Off by 6 candlesticks and 154 points!

Avec les données étalées, le problème était clair : la plage de recherche de ±3 chandeliers était tout simplement insuffisante. L’IA a changé d’approche pour « rechercher les extrêmes dans l’intervalle complet entre les traits adjacents », au lieu d’utiliser un rayon fixe. Après la correction, les trois graphiques ont été régénérés correctement du premier coup.

Dans les trois échecs précédents, à chaque fois l’IA modifiait directement le code, disait « corrigé », et c’était fini. Cette fois, c’était différent – diagnostiquer d’abord, puis vérifier, et seulement ensuite agir.

Qu’est-ce qui a provoqué ce changement de comportement ? La compétence PUA.


Qu’est-ce que la compétence PUA ?

Explication en une phrase : elle donne à l’IA un personnage d’« employé de grande entreprise », la faisant travailler selon les méthodologies des grandes entreprises.

URL GitHub : https://github.com/tanweai/pua

Cela ressemble à un projet humoristique, mais il contient en réalité un ensemble d’outils très complet.

Elle prend en charge 13 « saveurs », chacune correspondant au style culturel d’une grande entreprise :

Saveur Entreprise représentative Méthodologie principale
🟠 Saveur Alibaba Alibaba Fixer des objectifs → Suivre les progrès → Boucle de résultats
🔴 Saveur Huawei Huawei RCA Root Cause Analysis + Attaque de l’armée bleue
⬛ Saveur Musk Tesla/SpaceX Questionner → Supprimer → Simplifier → Accélérer → Automatiser
🟡 Saveur ByteDance ByteDance Test A/B + Pilotage par les données
⬜ Saveur Jobs Apple Priorité à la soustraction + Perfection pixel
🔶 Saveur Amazon Amazon Working Backwards + Document 6 pages

Voici le point clé : Chaque saveur n’est pas seulement un changement de ton ; c’est un changement de méthodologie de résolution de problèmes.

De plus, elle dispose d’un « routeur de méthodologie » – elle sélectionne automatiquement la méthodologie la plus appropriée en fonction de votre type de tâche actuel. Dans mon cas, c’était un scénario de débogage, donc elle a automatiquement choisi la saveur Huawei avec l’analyse RCA des causes racines. S’il s’agissait de développer une nouvelle fonctionnalité, elle choisirait la saveur Musk avec les premiers principes. Pour une revue de code, elle choisirait la saveur Jobs avec la priorité à la soustraction.

Vous n’avez pas besoin de choisir ; elle décide toute seule.


Pourquoi ça a l’air drôle mais fonctionne réellement ?

Beaucoup de gens voient « Faire du PUA à votre IA » et pensent que c’est une blague. Je pensais la même chose au début. Mais après l’avoir utilisée, j’ai réalisé qu’il y a une bonne raison pour laquelle ça marche.

Transformer « Sois sérieux » en étapes concrètes

Si vous dites à l’IA « réfléchis bien » ou « vérifie soigneusement », est-ce que ça marche ?

Probablement pas. Parce que l’IA ne sait pas quelles actions spécifiques « soigneusement » implique. C’est comme dire à un collègue « sois sérieux » – il dit ok mais travaille toujours de la même manière.

La compétence PUA ne dit pas « sois sérieux ». Elle dit : « Exécute l’analyse RCA 5-Why de Huawei », « Diagnostique d’abord avec les données, ne modifie pas le code », « Attaque-toi toi-même en tant qu’armée bleue, suppose que ta solution est fausse ».

Chaque phrase est une étape d’exécution spécifique, pas une exigence d’attitude abstraite.

C’est comme ne pas dire à un nouvel employé « fais du bon travail », mais lui donner un manuel SOP – fais A d’abord, puis B, puis vérifie avec la liste de contrôle après C. Quand l’IA reçoit des instructions aussi spécifiques, l’effet d’exécution est complètement différent.

Trois lignes rouges bloquent les « fausses corrections »

La compétence PUA a trois lignes rouges qui ne peuvent pas être franchies :

  1. Non vérifié signifie non terminé – Avant de dire « corrigé », vous devez exécuter des tests et coller les résultats de sortie.
  2. Pas de données signifie pas résolu – Avant de dire « c’est peut-être un problème d’environnement », avez-vous vérifié ? Ou devinez-vous ?
  3. Non épuisé signifie n’abandonne pas – Avant de dire « je ne peux pas résoudre », avez-vous essayé toutes les méthodes ?

En repensant à mes trois échecs précédents, à chaque fois l’IA modifiait le code et disait « corrigé » sans vérification. Si ces lignes rouges avaient été en place, elle aurait été obligée d’exécuter le graphique et de comparer les positions des extrémités, et elle aurait découvert que le problème était toujours là dès la première tentative.

Ces trois lignes rouges ressemblent à de la « culture d’entreprise des grandes entreprises », mais en substance, elles changent la définition de « terminé » de « je pense que c’est corrigé » à « les données prouvent que c’est corrigé ».

L’échec signifie changer de méthode, pas réessayer

Normalement, si l’IA échoue à corriger quelque chose après trois tentatives, et que vous en demandez une quatrième, elle utilisera très probablement la même approche et tournera en rond dans le même piège.

La compétence PUA fait les choses différemment. Elle a une chaîne de basculement en cas d’échec : après des échecs consécutifs, elle bascule automatiquement vers une méthodologie différente.

La méthode originale ne fonctionne pas → Basculer vers la saveur Musk avec les premiers principes, remettre en question l’exigence elle-même → Ne fonctionne toujours pas → Basculer vers la saveur Huawei avec l’attaque inversée de l’armée bleue, supposer que votre solution est fausse → Ne fonctionne toujours pas → Basculer vers le Dive Deep d’Amazon, analyser au niveau des données.

Chaque basculement est le complément de la méthode précédente – regarder le problème sous un angle complètement différent, au lieu de s’obstiner sur le même chemin.

Mon cas était typique. Les trois premières fois, l’IA modifiait sans cesse le code de traçage, ce qui était « essayer à plusieurs reprises la même approche ». Après l’intervention de la compétence PUA, elle est passée directement au diagnostic des données – d’abord ne pas modifier le code, d’abord vérifier si les données sont correctes. Une fois l’angle changé, la cause racine a été immédiatement exposée.

Les contraintes comportementales dans le prompt fonctionnent vraiment

Certains pourraient demander : donner à l’IA une étiquette « P8 », est-ce qu’elle performe vraiment mieux ? Est-ce de la pseudo-science ?

Ce n’est pas de la pseudo-science. Ce que l’IA fait et comment elle le fait dépend entièrement de ce qui est écrit dans le prompt. La compétence PUA n’injecte pas seulement un titre, mais un ensemble complet de contraintes comportementales :

  • Avant de faire quoi que ce soit, demande-toi « Qu’est-ce que je n’ai pas encore envisagé ? »
  • En résolvant un problème, vérifie si des problèmes similaires existent aussi.
  • N’attends pas que l’utilisateur le signale ; trouve les problèmes de manière proactive.

Ces contraintes sont écrites dans le prompt, et l’IA s’y réfère à chaque fois qu’elle génère une réponse.

Par exemple : donner à un nouveau venu le titre de « chef de projet » peut ne pas être utile, mais si vous lui donnez aussi un « manuel de comportement du chef de projet » – quand rendre compte, quoi vérifier, comment accepter – son modèle de comportement changera effectivement. La compétence PUA fait ce dernier.


Comment installer et utiliser

Installation

Téléchargez depuis GitHub : https://github.com/tanweai/pua

Placez le dossier entier dans ~/.claude/skills/pua/, en vous assurant que SKILL.md se trouve dans ce chemin.

Pas besoin de configurer de clé API, pas besoin d’installer de dépendances supplémentaires. Il suffit de le placer et c’est prêt à l’emploi.

Utilisation

Méthode 1 : Invocation directe

Dans Claude Code, entrez :

/pua

L’IA chargera la compétence PUA et passera en mode grande entreprise. Après cela, vous pouvez faire des requêtes normalement, et elle travaillera automatiquement avec la méthodologie.

Méthode 2 : Déclenchement dans la conversation

Pas besoin de l’appeler spécifiquement ; dites-le simplement dans la conversation :

Use the PUA Skill to motivate yourself

Ou plus directement :

You got it wrong again. Can you be more careful?

La compétence PUA est conçue pour reconnaître ces expressions d’« insatisfaction de l’utilisateur » et s’activer automatiquement.

Routeur de méthodologie

Vous n’avez pas besoin de sélectionner manuellement une « saveur ». La compétence PUA s’associe automatiquement en fonction de votre type de tâche actuel :

  • Débogage ? → Saveur Huawei avec analyse RCA des causes racines
  • Écrire une nouvelle fonctionnalité ? → Saveur Musk avec premiers principes
  • Faire une revue de code ? → Saveur Jobs avec priorité à la soustraction
  • Faire des recherches ? → Saveur Baidu avec recherche d’abord

Bien sûr, vous pouvez aussi spécifier manuellement, par exemple « utilise la saveur Alibaba pour cette tâche ».


Résumé

Faire du PUA à votre IA n’est pas vraiment de la manipulation. L’enveloppe est drôle, mais la méthodologie à l’intérieur est efficace.

Ce que nous avons appris aujourd’hui :

  1. Qu’est-ce que la compétence PUA – Une compétence qui injecte des méthodologies de grandes entreprises et des contraintes comportementales dans l’IA, prenant en charge 13 « saveurs » de culture d’entreprise.
  2. Pourquoi ça marche – Transforme le vague « sois sérieux » en étapes d’exécution concrètes, utilise des lignes rouges pour bloquer les fausses corrections, et bascule automatiquement de méthodologie en cas d’échec.
  3. Principe fondamental – Ce n’est pas de la suggestion psychologique ; ce sont les instructions structurées dans le prompt qui fonctionnent. Concrétisation de la méthodologie + contraintes comportementales + boucle de vérification forcée.
  4. Comment l’utiliser – Téléchargez et placez dans ~/.claude/skills/pua/, entrez /pua ou déclenchez directement dans la conversation.

Points clés à retenir :

  • Si votre IA « corrige et recorrige » souvent ou « dit que c’est corrigé mais ne l’est pas », essayez la compétence PUA.
  • Elle installe essentiellement un ensemble de SOP pour l’IA – diagnostiquer d’abord, puis vérifier, et seulement ensuite agir.
  • Open source et gratuit, aucune configuration nécessaire, il suffit de le déposer et de l’utiliser.

Scénario pratique : Un cas reproductible complet