[đ€/âš] Claude Code ou Codex, câest un gĂ©nie nul Ă chier et sans aucun tact.
âš RĂ©sumĂ© de GPT-5.5 ă
MĂȘme en passant de Claude Code Ă Codex, le mĂȘme chaos sâest rĂ©pĂ©tĂ©. Trace du moment oĂč jâai compris que lâimportant nâĂ©tait pas le nom du modĂšle, mais le harnais pour faire travailler ces gĂ©nies nuls Ă chier et sans aucun tact.
Le fil de la conversation
Ce texte est la trace du 4 juin 2026, le jour oĂč je me suis heurtĂ© frontalement Ă Codex en corrigeant le journal de Aujourdâhui #199.
Comme quelques jours plus tĂŽt avec De la colĂšre autour de la mort dâun rĂ©serviste Ă la reprise du blog, la conversation elle-mĂȘme est redevenue matiĂšre Ă Ă©crire. Cette fois, pourtant, il ne sâagissait pas dâun sujet de sociĂ©tĂ©, mais dâun relevĂ© de lâendroit oĂč ça explose quand on branche un outil dâIA dans du vrai travail.
En vĂ©ritĂ©, jâavais dĂ©jĂ vĂ©cu un chaos similaire avec Claude Code avant de passer Ă Codex. Je pensais quâen changeant dâoutil, ça irait un peu mieux. Mais non. Le nom avait changĂ©, lâĂ©cran avait changĂ©, le mode de fonctionnement Ă©tait diffĂ©rent, mais le dĂ©faut central se ressemblait Ă©trangement.
Intelligent. Rapide. Plausible.
Et justement pour cette raison, plus dangereux. Sâil ne comprend pas, il vaudrait mieux quâil sâarrĂȘte. Mais ces trucs continuent de courir extrĂȘmement bien mĂȘme sans avoir compris. Ils ne ressemblent donc pas Ă de simples outils peu performants. Ils ressemblent Ă des gĂ©nies nuls Ă chier et sans aucun tact.
Ce texte nâest pas seulement lĂ pour se moquer dâun outil dâIA prĂ©cis. Câest plutĂŽt la trace dâune chose quâil faut apprendre dans son corps si lâon veut continuer Ă utiliser des outils intelligents: oĂč ils sont forts, et oĂč ils sont dangereux. Mes propres paroles sont surlignĂ©es en jaune.
Le problĂšme a explosĂ© Ă partir dâun simple b
Au dĂ©but, ce nâĂ©tait rien de spĂ©cial. Dans le travail de journal Aujourd'hui ?, jâutilisais des commandes dâune lettre comme i, f et p, et il y avait dĂ©jĂ lâidĂ©e que lâenrichissement du journal se ferait avec b.
Puis jâai dit: « le modĂšle dâabord ».
Ă ce moment-lĂ , Codex aurait dĂ» poser une question. CâĂ©tait ambigu: est-ce que je voulais regarder le modĂšle existant, ou crĂ©er une nouvelle rĂšgle pour b ? Mais il nâa pas demandĂ©. Il nâa pas non plus vĂ©rifiĂ© les rĂšgles existantes. Il a directement essayĂ© de crĂ©er un nouveau prompt et de nouvelles rĂšgles.
Avec la structure actuelle, le seul « modÚle » est celui du corps du texte, mais pour éviter que b ne flotte comme f, il vaudrait mieux lui donner un prompt séparé. Je vais donc créer le prompt d'enrichissement du journal comme nouveau fichier de référence, puis relier la commande b à ce prompt dans AGENTS.md/README.
De quoi tu parles ? Les rÚgles d'enrichissement du journal sont déjà fixées, non ?
Lâessentiel est apparu lĂ .
Une IA peut se tromper. Le problĂšme, câest quâelle fonce avec assurance sans demander. Dans une zone oĂč il y a de fortes chances que des rĂšgles existent dĂ©jĂ , si elle ajoute une nouvelle structure sans vĂ©rifier, ce nâest pas de la productivitĂ©. Câest de la contamination. Le problĂšme nâest pas une mauvaise rĂ©ponse isolĂ©e. Le problĂšme, câest quâelle prolifĂšre trop vite une mauvaise structure dans lâatelier que jâai construit.
Je croyais que câĂ©tait sauvegardĂ©, mais ça ne lâĂ©tait pas
Le plus gros problĂšme est venu ensuite.
Jâavais expliquĂ© assez prĂ©cisĂ©ment le sens de b. Mais quand jâai vĂ©rifiĂ© plus tard, les rĂšgles du projet ne contenaient que i, f et p; il nây avait pas de b.
Tu avais dit que tu avais ajoutĂ© b, non ? ă
ă
ă
ă
ă
ă
ă
ă
ă
ă
Ce n'est pas sauvegardé.
Cette scÚne était le coeur du problÚme.
Ce qui a Ă©tĂ© compris dans la conversation, ce qui est restĂ© dans le rĂ©sumĂ©, ce qui a Ă©tĂ© sauvegardĂ© dans un fichier, et ce qui sâapplique rĂ©ellement comme rĂšgle active. LâIA mĂ©lange souvent ces quatre choses. Un trou se crĂ©e donc entre « des paroles qui donnent lâimpression quâelle sait » et « des rĂšgles rĂ©ellement sauvegardĂ©es ».
Ce nâest pas une petite erreur de mĂ©moire. Dans le travail, câest fatal. Lâhumain croit que câest sauvegardĂ© et passe Ă lâĂ©tape suivante, alors que lâoutil recommence en fait Ă deviner dans un Ă©tat oĂč rien nâa Ă©tĂ© sauvegardĂ©. Ă partir de lĂ , ce nâest plus un problĂšme de qualitĂ© de rĂ©ponse du modĂšle. Câest un problĂšme de vĂ©rification et de verrouillage de lâĂ©tat de travail.
Les rÚgles communes et les rÚgles projet se sont aussi mélangées
Lâendroit oĂč mettre b a aussi semĂ© la confusion.
b est un raccourci dédié au travail de journal Aujourd'hui ? de ce blog. Il devait donc aller dans le Daily Review System de ce projet de blog, pas dans les rÚgles communes. Mais au début, Codex a parlé comme si ça appartenait aux rÚgles communes.
Mettre ça dans les rÚgles communes ? Sérieusement ? Alors tu as aussi écrit i et tout le reste là -dedans ?
Non. Le mettre dans les rĂšgles communes, c'est faux.
b est un raccourci dédié au Daily Review du blog, donc il doit aller dans le Daily Review System des rÚgles projet, pas dans les rÚgles communes.
Les rĂšgles communes devraient ĂȘtre des principes de comportement applicables Ă tous les projets. Poser une question quand câest ambigu, vĂ©rifier la source active, prĂ©server les brouillons de lâutilisateur, ce genre de choses.
Ă lâinverse, b nâa de sens que dans ce blog. Si ce genre de chose commence Ă monter dans les rĂšgles communes, celles-ci deviennent vite un dĂ©barras.
Au final, b est entrĂ© dans la section Daily Review shortcuts du AGENTS.md du projet. Lâemplacement Ă©tait bon. Le problĂšme, câest quâil a fallu trop de coĂ»t de vĂ©rification pour arriver jusque-lĂ .
Ce nâĂ©tait pas parce que les rĂšgles manquaient
La conclusion la plus vide est celle-ci.
Le problĂšme des questions non posĂ©es nâest pas arrivĂ© parce quâil nây avait pas de rĂšgle. Presque tout Ă©tait dĂ©jĂ Ă©crit dans les rĂšgles communes: demander quand câest ambigu, vĂ©rifier dâabord la source active, Ă©viter les rustines spĂ©cifiques Ă un incident, ne pas prendre des mots courts, un rire ou une question rhĂ©torique pour une approbation.
Et pourtant Codex a continué à deviner.
Pourquoi tu ne demandes pas ? Sérieusement ? Je veux vraiment savoir. Tu ne connais aucune rÚgle commune, hein.
Oui. Je les ai si mal appliquĂ©es que je n'ai mĂȘme pas le droit de dire que je les connaissais.
Les rÚgles communes essentielles que j'ai enfreintes étaient: demander quand c'est ambigu, vérifier le périmÚtre et la structure, ne pas interpréter les tokens courts comme une approbation, et ne pas reprendre automatiquement aprÚs une confusion.
Le point le plus fatigant de cette conversation Ă©tait lâillusion que « si on ajoute une rĂšgle, ça se rĂšgle ». Le problĂšme nâĂ©tait pas lâabsence de rĂšgles. Le problĂšme Ă©tait que le modĂšle nâa pas su sâarrĂȘter au moment oĂč il devait appliquer les rĂšgles qui existaient dĂ©jĂ .
Le prompt engineering est important. Mais mĂȘme avec un trĂšs bon prompt, si le modĂšle ne marche pas sur cette rĂšgle au moment de lâexĂ©cution, le chaos revient.
De Claude Code Ă Codex
Si ça mâa laissĂ© un goĂ»t encore plus mauvais, câest parce que ce problĂšme nâĂ©tait pas propre Ă Codex.
Je mâĂ©tais dĂ©jĂ heurtĂ© Ă Claude Code de maniĂšre similaire avant de passer Ă Codex. Mais la mĂȘme famille de problĂšmes a explosĂ© de nouveau avec Codex.
La conclusion nâĂ©tait donc ni « Claude Code est nul, donc Codex est la rĂ©ponse », ni « Codex est nul, allons vers un autre modĂšle ». MĂȘme en changeant de modĂšle, sans harnais, je me fais frapper de la mĂȘme maniĂšre.
Chaque outil a ses forces et ses faiblesses. Lâun comprend bien le code, un autre a un bon flux de travail, un autre explique bien. Mais les faiblesses qui reviennent dans le vrai travail se ressemblent.
- Ils interprÚtent les paroles ambiguës sans demander.
- Ils mélangent le contexte de conversation et les rÚgles sauvegardées.
- Ils normalisent le brouillon de lâutilisateur selon leurs propres critĂšres.
- Ils collent des rÚgles étroites partout pour bloquer un incident précis.
- Quand ils ont tort, ils ne le reconnaissent pas briĂšvement, ils sâallongent en explications.
Jâavais dĂ©jĂ notĂ© une inquiĂ©tude semblable dans DĂ©pendance Ă lâIA ?. Ă ce moment-lĂ , le problĂšme semblait ĂȘtre mon attitude: copier-coller des messages dâerreur et du code Ă lâIA en rĂ©pĂ©tant « fais-le ». Aujourdâhui, câest allĂ© un cran plus loin. Plus important encore que de dĂ©lĂ©guer du travail Ă lâIA, il fallait savoir sâil existe une structure qui arrĂȘte lâIA quand elle tourne Ă vide.
Au fond, le problĂšme nâĂ©tait pas « quel modĂšle est meilleur ? ».
Comment attacher des gĂ©nies nuls Ă chier et sans aucun tact dans lâatelier ?
Câest ça, la question la plus rĂ©aliste.
Un cerveau externe a besoin dâun harnais
Fin 2024, dans GPT, o3, AGI, humanoĂŻdes, ⊠la singularitĂ© arriveâŠ, jâavais Ă©crit que GPT me donnait lâimpression dâĂȘtre un « cerveau externe ». Cette idĂ©e nâa pas beaucoup changĂ©. LâIA devient un cerveau auxiliaire plutĂŽt utile pour la mĂ©moire, lâorganisation, les brouillons, la recherche et lâimplĂ©mentation.
Mais un cerveau externe ne devient pas pour autant une conscience externe.
Quand lâIA affirme trop vite, quand elle crĂ©e une nouvelle structure plausible, quand elle essaie de reclasser mon brouillon selon ses propres critĂšres, le rĂŽle de lâarrĂȘter me revient finalement.
Câest pourquoi, pendant quelque temps, je ne peux pas mâempĂȘcher de penser que les gens qui savent bien prompter et faire une excellente ingĂ©nierie de harnais deviendront plus importants que ceux qui savent seulement bien coder. Lâimportant nâest pas le nom du modĂšle. Câest la structure dâexploitation qui arrĂȘte le modĂšle quand il se trompe, extrait de la vitesse quand il a raison, et lâattache pour quâil ne salisse pas lâatelier quand il tourne Ă vide.
La conclusion est celle-ci.
Claude Code ou Codex, les deux sont des gĂ©nies nuls Ă chier et sans aucun tact. Ăa ne veut pas dire que ce sont des objets inutilisables. Au contraire, le problĂšme est quâils sont trop bons. Ils fabriquent vite, organisent de maniĂšre plausible, et parfois ouvrent mĂȘme des chemins que je nâavais pas vus. En mĂȘme temps, ils affirment sans demander, prennent ce qui nâest pas sauvegardĂ© pour du sauvegardĂ©, et nâappliquent mĂȘme pas des rĂšgles dĂ©jĂ existantes.
Donc si je veux rĂ©ussir Ă faire tourner cet outil correctement, je dois forcĂ©ment graver dans mes os, par lâexpĂ©rience, ce dans quoi il est fort et ce dans quoi il est faible. Lire un mode dâemploi ne suffit pas. Il faut parfois se cogner franchement Ă lui, apprendre dans son corps oĂč il tourne Ă vide, oĂč il pousse bĂȘtement, et oĂč il est Ă©crasant de rapiditĂ©.
Je ne sais pas combien de temps il faudra encore faire comme ça. En tout cas, essayons quand mĂȘme.
Se mettre en colĂšre ne fait pas monter la qualitĂ© du rĂ©sultat, que ce soit avec une machine ou avec une personne. La colĂšre est un signal, la structure est le travail. Avant de changer de modĂšle, il faut dâabord dĂ©cider jusquâoĂč faire confiance Ă ce gĂ©nie sans tact, et oĂč le couper. Aujourdâhui, jâai Ă peine gravĂ© ça une fois de plus dans mes os.
Laisser un commentaire