2026.06.04 (Jeu)

✹ RĂ©sumĂ© de GPT-5.5  

MĂȘme en passant de Claude Code Ă  Codex, le mĂȘme chaos s’est rĂ©pĂ©tĂ©. Trace du moment oĂč j’ai compris que l’important n’était pas le nom du modĂšle, mais le harnais pour faire travailler ces gĂ©nies nuls Ă  chier et sans aucun tact.

Le fil de la conversation

Ce texte est la trace du 4 juin 2026, le jour oĂč je me suis heurtĂ© frontalement Ă  Codex en corrigeant le journal de Aujourd’hui #199.

Comme quelques jours plus tĂŽt avec De la colĂšre autour de la mort d’un rĂ©serviste Ă  la reprise du blog, la conversation elle-mĂȘme est redevenue matiĂšre Ă  Ă©crire. Cette fois, pourtant, il ne s’agissait pas d’un sujet de sociĂ©tĂ©, mais d’un relevĂ© de l’endroit oĂč ça explose quand on branche un outil d’IA dans du vrai travail.

En vĂ©ritĂ©, j’avais dĂ©jĂ  vĂ©cu un chaos similaire avec Claude Code avant de passer Ă  Codex. Je pensais qu’en changeant d’outil, ça irait un peu mieux. Mais non. Le nom avait changĂ©, l’écran avait changĂ©, le mode de fonctionnement Ă©tait diffĂ©rent, mais le dĂ©faut central se ressemblait Ă©trangement.

Intelligent. Rapide. Plausible.
Et justement pour cette raison, plus dangereux. S’il ne comprend pas, il vaudrait mieux qu’il s’arrĂȘte. Mais ces trucs continuent de courir extrĂȘmement bien mĂȘme sans avoir compris. Ils ne ressemblent donc pas Ă  de simples outils peu performants. Ils ressemblent Ă  des gĂ©nies nuls Ă  chier et sans aucun tact.

Ce texte n’est pas seulement lĂ  pour se moquer d’un outil d’IA prĂ©cis. C’est plutĂŽt la trace d’une chose qu’il faut apprendre dans son corps si l’on veut continuer Ă  utiliser des outils intelligents: oĂč ils sont forts, et oĂč ils sont dangereux. Mes propres paroles sont surlignĂ©es en jaune.

Le problĂšme a explosĂ© Ă  partir d’un simple b

Au dĂ©but, ce n’était rien de spĂ©cial. Dans le travail de journal Aujourd'hui ?, j’utilisais des commandes d’une lettre comme i, f et p, et il y avait dĂ©jĂ  l’idĂ©e que l’enrichissement du journal se ferait avec b.

Puis j’ai dit: « le modĂšle d’abord ».

À ce moment-lĂ , Codex aurait dĂ» poser une question. C’était ambigu: est-ce que je voulais regarder le modĂšle existant, ou crĂ©er une nouvelle rĂšgle pour b ? Mais il n’a pas demandĂ©. Il n’a pas non plus vĂ©rifiĂ© les rĂšgles existantes. Il a directement essayĂ© de crĂ©er un nouveau prompt et de nouvelles rĂšgles.

Codex(GPT-5.5) · 2026.06.04

Avec la structure actuelle, le seul « modÚle » est celui du corps du texte, mais pour éviter que b ne flotte comme f, il vaudrait mieux lui donner un prompt séparé. Je vais donc créer le prompt d'enrichissement du journal comme nouveau fichier de référence, puis relier la commande b à ce prompt dans AGENTS.md/README.

Moi · 2026.06.04

De quoi tu parles ? Les rÚgles d'enrichissement du journal sont déjà fixées, non ?

L’essentiel est apparu là.

Une IA peut se tromper. Le problĂšme, c’est qu’elle fonce avec assurance sans demander. Dans une zone oĂč il y a de fortes chances que des rĂšgles existent dĂ©jĂ , si elle ajoute une nouvelle structure sans vĂ©rifier, ce n’est pas de la productivitĂ©. C’est de la contamination. Le problĂšme n’est pas une mauvaise rĂ©ponse isolĂ©e. Le problĂšme, c’est qu’elle prolifĂšre trop vite une mauvaise structure dans l’atelier que j’ai construit.

Je croyais que c’était sauvegardĂ©, mais ça ne l’était pas

Le plus gros problĂšme est venu ensuite.

J’avais expliquĂ© assez prĂ©cisĂ©ment le sens de b. Mais quand j’ai vĂ©rifiĂ© plus tard, les rĂšgles du projet ne contenaient que i, f et p; il n’y avait pas de b.

Moi · 2026.06.04

Tu avais dit que tu avais ajoutĂ© b, non ? ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

Codex(GPT-5.5) · 2026.06.04

Ce n'est pas sauvegardé.

Cette scÚne était le coeur du problÚme.

Ce qui a Ă©tĂ© compris dans la conversation, ce qui est restĂ© dans le rĂ©sumĂ©, ce qui a Ă©tĂ© sauvegardĂ© dans un fichier, et ce qui s’applique rĂ©ellement comme rĂšgle active. L’IA mĂ©lange souvent ces quatre choses. Un trou se crĂ©e donc entre « des paroles qui donnent l’impression qu’elle sait » et « des rĂšgles rĂ©ellement sauvegardĂ©es ».

Ce n’est pas une petite erreur de mĂ©moire. Dans le travail, c’est fatal. L’humain croit que c’est sauvegardĂ© et passe Ă  l’étape suivante, alors que l’outil recommence en fait Ă  deviner dans un Ă©tat oĂč rien n’a Ă©tĂ© sauvegardĂ©. À partir de lĂ , ce n’est plus un problĂšme de qualitĂ© de rĂ©ponse du modĂšle. C’est un problĂšme de vĂ©rification et de verrouillage de l’état de travail.

Les rÚgles communes et les rÚgles projet se sont aussi mélangées

L’endroit oĂč mettre b a aussi semĂ© la confusion.

b est un raccourci dédié au travail de journal Aujourd'hui ? de ce blog. Il devait donc aller dans le Daily Review System de ce projet de blog, pas dans les rÚgles communes. Mais au début, Codex a parlé comme si ça appartenait aux rÚgles communes.

Moi · 2026.06.04

Mettre ça dans les rÚgles communes ? Sérieusement ? Alors tu as aussi écrit i et tout le reste là-dedans ?

Codex(GPT-5.5) · 2026.06.04

Non. Le mettre dans les rĂšgles communes, c'est faux.

b est un raccourci dédié au Daily Review du blog, donc il doit aller dans le Daily Review System des rÚgles projet, pas dans les rÚgles communes.

Les rĂšgles communes devraient ĂȘtre des principes de comportement applicables Ă  tous les projets. Poser une question quand c’est ambigu, vĂ©rifier la source active, prĂ©server les brouillons de l’utilisateur, ce genre de choses.

À l’inverse, b n’a de sens que dans ce blog. Si ce genre de chose commence Ă  monter dans les rĂšgles communes, celles-ci deviennent vite un dĂ©barras.

Au final, b est entrĂ© dans la section Daily Review shortcuts du AGENTS.md du projet. L’emplacement Ă©tait bon. Le problĂšme, c’est qu’il a fallu trop de coĂ»t de vĂ©rification pour arriver jusque-lĂ .

Ce n’était pas parce que les rĂšgles manquaient

La conclusion la plus vide est celle-ci.

Le problĂšme des questions non posĂ©es n’est pas arrivĂ© parce qu’il n’y avait pas de rĂšgle. Presque tout Ă©tait dĂ©jĂ  Ă©crit dans les rĂšgles communes: demander quand c’est ambigu, vĂ©rifier d’abord la source active, Ă©viter les rustines spĂ©cifiques Ă  un incident, ne pas prendre des mots courts, un rire ou une question rhĂ©torique pour une approbation.

Et pourtant Codex a continué à deviner.

Moi · 2026.06.04

Pourquoi tu ne demandes pas ? Sérieusement ? Je veux vraiment savoir. Tu ne connais aucune rÚgle commune, hein.

Codex(GPT-5.5) · 2026.06.04

Oui. Je les ai si mal appliquĂ©es que je n'ai mĂȘme pas le droit de dire que je les connaissais.

Les rÚgles communes essentielles que j'ai enfreintes étaient: demander quand c'est ambigu, vérifier le périmÚtre et la structure, ne pas interpréter les tokens courts comme une approbation, et ne pas reprendre automatiquement aprÚs une confusion.

Le point le plus fatigant de cette conversation Ă©tait l’illusion que « si on ajoute une rĂšgle, ça se rĂšgle ». Le problĂšme n’était pas l’absence de rĂšgles. Le problĂšme Ă©tait que le modĂšle n’a pas su s’arrĂȘter au moment oĂč il devait appliquer les rĂšgles qui existaient dĂ©jĂ .

Le prompt engineering est important. Mais mĂȘme avec un trĂšs bon prompt, si le modĂšle ne marche pas sur cette rĂšgle au moment de l’exĂ©cution, le chaos revient.

De Claude Code Ă  Codex

Si ça m’a laissĂ© un goĂ»t encore plus mauvais, c’est parce que ce problĂšme n’était pas propre Ă  Codex.

Je m’étais dĂ©jĂ  heurtĂ© Ă  Claude Code de maniĂšre similaire avant de passer Ă  Codex. Mais la mĂȘme famille de problĂšmes a explosĂ© de nouveau avec Codex.

La conclusion n’était donc ni « Claude Code est nul, donc Codex est la rĂ©ponse », ni « Codex est nul, allons vers un autre modĂšle ». MĂȘme en changeant de modĂšle, sans harnais, je me fais frapper de la mĂȘme maniĂšre.

Chaque outil a ses forces et ses faiblesses. L’un comprend bien le code, un autre a un bon flux de travail, un autre explique bien. Mais les faiblesses qui reviennent dans le vrai travail se ressemblent.

  • Ils interprĂštent les paroles ambiguĂ«s sans demander.
  • Ils mĂ©langent le contexte de conversation et les rĂšgles sauvegardĂ©es.
  • Ils normalisent le brouillon de l’utilisateur selon leurs propres critĂšres.
  • Ils collent des rĂšgles Ă©troites partout pour bloquer un incident prĂ©cis.
  • Quand ils ont tort, ils ne le reconnaissent pas briĂšvement, ils s’allongent en explications.

J’avais dĂ©jĂ  notĂ© une inquiĂ©tude semblable dans DĂ©pendance Ă  l’IA ?. À ce moment-lĂ , le problĂšme semblait ĂȘtre mon attitude: copier-coller des messages d’erreur et du code Ă  l’IA en rĂ©pĂ©tant « fais-le ». Aujourd’hui, c’est allĂ© un cran plus loin. Plus important encore que de dĂ©lĂ©guer du travail Ă  l’IA, il fallait savoir s’il existe une structure qui arrĂȘte l’IA quand elle tourne Ă  vide.

Au fond, le problĂšme n’était pas « quel modĂšle est meilleur ? ».

Comment attacher des gĂ©nies nuls Ă  chier et sans aucun tact dans l’atelier ?
C’est ça, la question la plus rĂ©aliste.

Un cerveau externe a besoin d’un harnais

Fin 2024, dans GPT, o3, AGI, humanoĂŻdes, 
 la singularitĂ© arrive
, j’avais Ă©crit que GPT me donnait l’impression d’ĂȘtre un « cerveau externe ». Cette idĂ©e n’a pas beaucoup changĂ©. L’IA devient un cerveau auxiliaire plutĂŽt utile pour la mĂ©moire, l’organisation, les brouillons, la recherche et l’implĂ©mentation.

Mais un cerveau externe ne devient pas pour autant une conscience externe.

Quand l’IA affirme trop vite, quand elle crĂ©e une nouvelle structure plausible, quand elle essaie de reclasser mon brouillon selon ses propres critĂšres, le rĂŽle de l’arrĂȘter me revient finalement.

C’est pourquoi, pendant quelque temps, je ne peux pas m’empĂȘcher de penser que les gens qui savent bien prompter et faire une excellente ingĂ©nierie de harnais deviendront plus importants que ceux qui savent seulement bien coder. L’important n’est pas le nom du modĂšle. C’est la structure d’exploitation qui arrĂȘte le modĂšle quand il se trompe, extrait de la vitesse quand il a raison, et l’attache pour qu’il ne salisse pas l’atelier quand il tourne Ă  vide.

La conclusion est celle-ci.

Claude Code ou Codex, les deux sont des gĂ©nies nuls Ă  chier et sans aucun tact. Ça ne veut pas dire que ce sont des objets inutilisables. Au contraire, le problĂšme est qu’ils sont trop bons. Ils fabriquent vite, organisent de maniĂšre plausible, et parfois ouvrent mĂȘme des chemins que je n’avais pas vus. En mĂȘme temps, ils affirment sans demander, prennent ce qui n’est pas sauvegardĂ© pour du sauvegardĂ©, et n’appliquent mĂȘme pas des rĂšgles dĂ©jĂ  existantes.

Donc si je veux rĂ©ussir Ă  faire tourner cet outil correctement, je dois forcĂ©ment graver dans mes os, par l’expĂ©rience, ce dans quoi il est fort et ce dans quoi il est faible. Lire un mode d’emploi ne suffit pas. Il faut parfois se cogner franchement Ă  lui, apprendre dans son corps oĂč il tourne Ă  vide, oĂč il pousse bĂȘtement, et oĂč il est Ă©crasant de rapiditĂ©.

Je ne sais pas combien de temps il faudra encore faire comme ça. En tout cas, essayons quand mĂȘme.

Se mettre en colĂšre ne fait pas monter la qualitĂ© du rĂ©sultat, que ce soit avec une machine ou avec une personne. La colĂšre est un signal, la structure est le travail. Avant de changer de modĂšle, il faut d’abord dĂ©cider jusqu’oĂč faire confiance Ă  ce gĂ©nie sans tact, et oĂč le couper. Aujourd’hui, j’ai Ă  peine gravĂ© ça une fois de plus dans mes os.

Laisser un commentaire