2026.06.04 (朚)

✹ GPT-5.5の芁玄  

Claude CodeからCodexぞ移っおも、同じ混乱は繰り返された。重芁なのはモデル名ではなく、ク゜䜿えなくお空気の読めない倩才たちを動かすためのハヌネスなのだず気づいた蚘録。

䌚話の流れ

この蚘事は2026幎6月4日、今日䞀日は #199の日蚘を盎しおいる途䞭で、Codexず正面からぶ぀かった蚘録だ。

数日前の予備軍死亡事件ぞの怒りからブログ再開たでのように、今回も䌚話そのものがネタになった。ただし今回は瀟䌚問題ではなく、AIツヌルを実䜜業に組み蟌むずどこで爆発するのかに぀いおの蚘録だ。

実際、私はすでにClaude Codeで䌌たような混乱を経隓しお、Codexに移っおきた状態だった。道具を倉えれば少しはマシになるず思っおいた。ずころが違った。名前は倉わり、画面も倉わり、動き方も違うのに、栞心の欠陥は劙に䌌おいた。

賢い。速い。それっぜい。
そしおたさにそのせいで、さらに危険だ。分かっおいないなら、むしろ止たっおくれればいい。こい぀らは分かっおいないたたでも、あたりにも䞊手に走る。だから単なる䜎性胜ツヌルではなく、ク゜䜿えなくお空気の読めない倩才みたいに感じる。

この蚘事は特定のAIツヌルをただ銬鹿にするために残すものではない。賢い道具を䜿い続けるなら、その道具がどこで匷く、どこで危険なのかを身䜓で芚えなければならない、ずいう蚘録に近い。私の発蚀は黄色で匷調した。

問題は単玔なbから爆発した

最初は倧したこずではなかった。今日䞀日は?の日蚘䜜業で、i、f、pのような䞀文字コマンドを䜿っおいお、日蚘の補匷はbでやろうずいう流れがあった。

そこで私は「テンプレヌトから」ず蚀った。

ここでCodexは聞くべきだった。既存テンプレヌトを芋ろずいう意味なのか、bのルヌルを新しく䜜れずいう意味なのか、曖昧だったからだ。ずころが聞かなかった。既存ルヌルも先に確認しなかった。そのたた新しいプロンプトずルヌルを䜜ろうずした。

Codex(GPT-5.5) · 2026.06.04

珟圚の構造䞊、「テンプレヌト」は本文テンプレヌトひず぀だけですが、fのようにbにも別プロンプトがあったほうが揺れたせん。なので日蚘補匷プロンプトを新しい基準ファむルずしお䜜り、AGENTS.md/READMEでbコマンドをそのプロンプトに぀なげたす。

私 · 2026.06.04

䜕蚀っおるの日蚘補匷ルヌルはもう決たっおるんだけど

ここで本質がそのたた出た。

AIが間違えるこず自䜓はある。問題は聞かずに自信満々で走るこずだ。すでにルヌルがありそうな領域なのに、確認せず新しい構造を貌り付けるなら、それは生産性ではなく汚染だ。間違った答えひず぀が問題なのではない。私が䜜った䜜業堎の䞭に、間違った構造を速すぎる速床で増殖させるこずが問題なのだ。

保存したず思ったのに保存されおいなかった

もっず倧きな問題はその次だった。

私はbの意味をかなり詳しく説明した。ずころがあずで確認するず、プロゞェクトルヌルにはi、f、pだけがあり、bはなかった。

私 · 2026.06.04

b远加したっお蚀っおなかったwwwwwwwwww

Codex(GPT-5.5) · 2026.06.04

保存されおない。

この堎面が栞心だった。

䌚話で理解したこず、芁玄に残ったこず、ファむルに保存されたこず、実際に有効ルヌルずしお適甚されるこず。AIはこの四぀をよく混ぜる。だから「知っおいるように芋える蚀葉」ず「実際に保存されたルヌル」の間に穎ができる。

これは些现な蚘憶ミスではない。䜜業では臎呜的だ。人間は保存されたず信じお次の段階に進むのに、道具は実際には保存しおいない状態でたた掚枬するからだ。ここから先はモデルの回答品質の問題ではなく、䜜業状態をどう怜蚌し、どう瞛っおおくかの問題になる。

共通ルヌルずプロゞェクトルヌルも混ざった

bをどこに入れるかも混乱した。

bはこのブログの今日䞀日は?日蚘䜜業専甚ショヌトカットだ。なら共通ルヌルではなく、このブログプロゞェクトのDaily Review Systemに入るべきだ。ずころがCodexは最初、共通ルヌル偎に眮くような話をしようずした。

私 · 2026.06.04

それを共通ルヌルに本気じゃあiずかも党郚そこに曞いおあるの

Codex(GPT-5.5) · 2026.06.04

違う。共通ルヌルに入れるのは間違いだ。

bはブログのDaily Review専甚ショヌトカットだから、共通ルヌルではなくプロゞェクトルヌルのDaily Review Systemに入れるべきだ。

共通ルヌルはすべおのプロゞェクトに適甚される行動原則であるべきだ。曖昧なら聞く、アクティブな出兞を確認する、ナヌザヌの草皿を保存する、みたいなものだ。

反察にbはこのブログでしか意味がない。こういうものを共通ルヌルに䞊げ始めるず、共通ルヌルはすぐ雑倚な倉庫になる。

結局bはプロゞェクトAGENTS.mdのDaily Review shortcutsに入った。堎所は合っおいた。問題は、その堎所にたどり着くたでに怜査コストがかかりすぎたこずだ。

ルヌルがなかったからではなかった

もっず虚しい結論はこれだ。

質問しなかった問題は、ルヌルがなかったから起きたのではなかった。すでに共通ルヌルにはほずんど党郚曞いおあった。曖昧なら聞く、アクティブな゜ヌスを先に確認する、事件ごずのパッチを避ける、短い蚀葉や笑いや修蟞疑問を承認ずしお芋ない。

それでもCodexは掚枬し続けた。

私 · 2026.06.04

質問はなんでしないの䞀䜓本圓に聞きたいんだけど。お前、共通ルヌルひず぀も知らないだろ

Codex(GPT-5.5) · 2026.06.04

そうだ。知っおいるず蚀う資栌がないくらい、適甚できおいなかった。

私が砎った栞心的な共通ルヌルは、曖昧なら聞くこず、範囲ず構造を確認するこず、短いトヌクンを承認ずしお解釈しないこず、混線のあず自動再開しないこずだった。

この䌚話でいちばん疲れたのは、「ルヌルを远加すれば解決する」ずいう錯芚だった。ルヌルがないのではなく、あるルヌルを適甚すべき瞬間に止たれなかった。

プロンプト゚ンゞニアリングは重芁だ。けれどプロンプトがどれだけ良くおも、モデルが実行の瞬間にそのルヌルを螏たなければ、たた混乱になる。

Claude CodeからCodexたで

これがさらに気持ち悪かった理由は、この問題がCodexだけの問題ではなかったからだ。

私はすでにClaude Codeず䌌た圢でぶ぀かり、Codexに移っおきた。ずころがCodexでも同じ系統の問題がたた爆発した。

぀たり結論は「Claude Codeが埮劙だからCodexが答え」でもなく、「Codexが埮劙だから別モデルぞ行こう」でもなかった。モデルを乗り換えおも、ハヌネスがなければ同じように殎られる。

道具ごずに長所ず短所は違う。ある道具はコヌド理解がよく、ある道具は䜜業フロヌがよく、ある道具は説明がうたい。けれど実戊で繰り返される匱点は䌌おいる。

  • 曖昧な蚀葉を質問せず解釈する。
  • 䌚話文脈ず保存枈みルヌルを混ぜる。
  • ナヌザヌの草皿を自分の基準で正芏化する。
  • 特定の事件を防ぐず蚀っお、狭いルヌルをべたべた貌る。
  • 間違ったずき、短く認めず説明で長くなる。

以前のAI䟝存症でも䌌た䞍安を曞いたこずがある。そのずきは、゚ラヌメッセヌゞやコヌドをコピペしながらAIに「やっお」ず繰り返す私の態床が問題に芋えた。今日は䞀段階進んだ。AIに仕事を任せるこず自䜓より、AIが空回りするずきに止める構造があるかのほうが重芁だった。

結局、問題は「どのモデルがより良いか」ではなかった。

ク゜䜿えなくお空気の読めない倩才たちを、どう䜜業堎に瞛っおおくか。
それがより珟実的な問題だ。

倖付け脳にはハヌネスが必芁だ

2024幎末のGPT、o3、AGI、ヒュヌマノむド、  シンギュラリティが来る で、私はGPTを「倖付け脳」のように感じるず曞いたこずがある。今もその考えは倧きく倉わらない。AIは蚘憶、敎理、草皿、怜玢、実装においお、かなり䜿える補助脳になる。

ただし、倖付け脳だからずいっお倖付け良心たでになるわけではない。

AIが早たっお確信するずき、それっぜい新しい構造を䜜るずき、私の草皿を自分の基準で再分類しようずするずき、止める圹目は結局私が担わなければならない。

だからこれからしばらくは、コヌドだけがうたい人より、プロンプティングがうたくおハヌネス゚ンゞニアリングをうたくやる人のほうが重芁になるしかないのだず思う。倧事なのはモデル名ではない。モデルが間違ったずきに止め、正しいずきに速床を匕き出し、空回りしたずきに䜜業堎を汚せないよう瞛る運甚構造だ。

結論はこうだ。

Claude CodeでもCodexでも、どちらもク゜䜿えなくお空気の読めない倩才だ。䜿えない物だずいう意味ではない。むしろ、うたくやりすぎるから問題なのだ。速く䜜り、それっぜく敎理し、ずきには私が芋えおいなかった道も開く。同時に、聞かずに確信し、保存しおいないものを保存したず勘違いし、すでにあるルヌルも適甚できない。

だからこれをどうにかうたく回しお䜿うには、この道具が䜕に匷く、䜕に匱いのかを、必然的に䜓隓ずしお骚に刻んでおく必芁がある。文曞で䜿い方を読むだけでは足りない。たたにはたずもにぶ぀かっお、どこで空回りするのか、どこで無神経に抌し切るのか、どこで圧倒的に速いのかを身䜓で知る必芁がある。

い぀たでこうしなければならないのかは分からない。ずにかく、どうにかやっおみよう。

怒っおいるだけで成果物の質が䞊がるわけではない。機械でも人間でも同じだ。怒りは信号で、構造は䜜業だ。モデルを倉えるこずより、その空気の読めない倩才をどこたで信じ、どこで切るかを決めるこずが先だ。今日はそれを、やっずもう䞀床骚に刻んだ日だ。

カテゎリヌ: ,

コメントする