[📝] Hoy fue el día #204: Un día de pelearme con Codex
✨ Resumen de GPT-5.5
Un día en que registré mi frustración con Codex y GPT-5.5, aun así terminé la función de estadísticas de visitantes y la limpieza de Tadak Bible, y decidí usar intensamente durante un mes la suscripción de 300.000 wones.
💭 Diario
Hace unos días escribí Da igual si es Claude Code o Codex: es un genio completamente defectuoso y sin tacto, y hoy terminó siendo una extensión de aquello.
Cuando me pongo a discutir con Codex, siento que yo también me vuelvo tonto con él. Qué tan bien entiende con tacto lo que es “obvio sin necesidad de decirlo” parece ser rendimiento del modelo, es decir, inteligencia. Qué tan exactamente ejecuta lo que yo indiqué con claridad parece ser rendimiento del harness, es decir, estructura del sistema. Y GPT 5.5, puramente como modelo, rinde peor que Opus 4.5. Es tan frustrante que siento que voy a perder la cabeza. El harness de Codex en sí parece estar armado casi tan bien como Claude Code, así que intenté seguir usándolo… pero como la inteligencia/capacidad de razonamiento de GPT se siente insuficiente, las instrucciones del prompt tienen que volverse inútilmente específicas, y eso me enciende la rabia.
Para ser preciso, esto se acerca más a una comparación sentida después de usar Codex y Claude Code que a una comparación pura de modelos probada por benchmarks. Las reacciones en Reddit también están divididas. Hay testimonios de migración que dicen que GPT-5.5/Codex es mejor, reacciones que dicen que Opus/Claude Code es mejor, y comentarios de que Codex es lento pero cuidadoso mientras Claude Code es rápido.12345678
Bueno… en fin, hace dos días hice el pago de 300.000 wones por Pro 20x y reinicié la táctica al borde del precipicio, así que durante un mes tendré que usarlo tan intensamente como pueda. Y como he usado Claude Code durante tanto tiempo, lo había olvidado por un momento, pero al recordar cómo Opus 4.5 de pronto ni siquiera podía buscar bien, se volvió completamente tonto y abusaba de effort max, vuelvo a enfadarme. Bueno… por ahora, usémoslo.
🧭 Revisión de hoy(Daily Review)
Victoria/derrota de hoy
- Victoria: Insistí hasta el final y terminé implementando la función de estadísticas de visitantes; Tadak Bible por fin se reanudó.
- Derrota: La dieta es demasiado difícil, de verdad.
Objetivo central de hoy
-
Blog: publicar la función de agregación de estadísticas de visitantes
- Criterio de finalización: https://hyuk.blog/analytics accesible
- Por qué importa: Me da pereza entrar a Google Analytics para verlo.
-
Tadak Bible: reducir a 7 idiomas
- Criterio de finalización: reducir documentación/funciones de 22 idiomas a 7 idiomas
- Por qué importa: Intentar mantener 22 idiomas consume demasiados recursos en i18n y traducción.
Tareas de hoy
- Postular en Albamon/JobKorea
Resultado
- Lo que dejé hoy: función del blog, documentación de Tadak Bible
Registro de escape
- Escape antes del resultado: ninguno
- Razón del escape: ninguna
Registro corporal
- Peso: 85.1kg
- Dieta
- Desayuno: nada
- Almuerzo: jeyuk-bokkeum de panceta de cerdo, col
- Cena: arroz con curry, huevos cocidos, salteado de salchicha con verduras, ramen en vaso
- Ejercicio: 10000 pasos
🤖 Coaching de GPT-5.5(KPT)
Ejecución: Elon Musk | Para convertir la imaginación en realidad
- Mantener(Keep): Aunque estabas furioso peleándote con Codex, cerraste el día con resultados reales: estadísticas de visitantes publicadas, Tadak Bible reducido a 7 idiomas y postulaciones en Albamon/JobKorea.
- Problema(Problem): Si la rabia por el rendimiento de la herramienta crece demasiado, el sentimiento de “por qué no entiende esto” se come el centro de la ejecución más que los resultados que hiciste hoy.
- Intento(Try): Los 300.000 wones no son dinero de consuelo, sino presión de salida. Incluso en un día así, al final deben quedar una función, documentos y postulaciones.
- Pregunta(Question): ¿Qué te movió hoy: la rabia contra la herramienta, o la obstinación de producir algo incluso usando esa rabia?
Vigilancia: Sócrates | Para conocerme a mí mismo
- Mantener(Keep): Antes de llamarlo “comparación pura de modelos”, diste un paso atrás y lo llamaste comparación sentida, y también registraste que las reacciones de Reddit están divididas.
- Problema(Problem): Aun así, la conclusión de que “a GPT le falta inteligencia” todavía no separa del todo entorno de trabajo, harness, prompt y familiaridad.
- Intento(Try): La vigilancia de hoy no consiste en borrar la rabia, sino en preguntar hasta el final cuánto se adelantó la rabia al juicio de los hechos.
- Pregunta(Question): ¿Estás viendo el límite de la herramienta, o juzgando un Codex desconocido con el estándar de un Claude Code al que ya estabas acostumbrado?
Salud: Hipócrates | Para hacer del cuerpo la base de una vida honesta
- Mantener(Keep): Registraste 85.1kg, nada de desayuno, jeyuk-bokkeum con col, arroz con curry y ramen en vaso, y 10000 pasos sin ocultarlos.
- Problema(Problem): Los 10000 pasos están bien, pero saltarte el desayuno y juntar por la noche arroz con curry, huevos, salchicha con verduras y ramen en vaso es la base corporal de decir que la dieta es demasiado difícil.
- Intento(Try): El registro corporal no es para culparte, sino para ver el patrón. La señal central de hoy es: “caminé, pero el ritmo de comidas se tambaleó”.
- Pregunta(Question): ¿La dificultad de la dieta hoy fue falta de voluntad, o la protesta del cuerpo después de que se rompiera la distribución de energía del día?
Mentalidad: Viktor Frankl | Para sostener el sentido aun en el sufrimiento
- Mantener(Keep): No dejaste que la irritación y la rabia terminaran solo como explosión; apenas las giraste hacia el sentido de “usarlo intensamente durante un mes”.
- Problema(Problem): Llegar a sentir que te vuelves tonto discutiendo con Codex es señal de que el problema de la herramienta invadió tu sensación de ti mismo.
- Intento(Try): El sentido que debes sostener hoy no es la alegría de encontrar una buena herramienta, sino la actitud de convertir una mala experiencia, 300.000 wones y un mes en un experimento.
- Pregunta(Question): ¿Vas a recibir esta frustración solo como una ofensa, o también como material para un experimento de un mes?
Filosofía: Nietzsche | Para vivir como Peaceful Übermensch with Jesus
- Mantener(Keep): Aunque la herramienta te disgustó, no te detuviste y empujaste hasta terminar estadísticas de visitantes y limpieza de Tadak Bible. Había fuerza.
- Problema(Problem): Pero si la rabia de “siento que me vuelvo tonto” se endurece como desprecio hacia personas y herramientas, esa fuerza se vuelve cinismo, no superación de uno mismo.
- Intento(Try): Un Peaceful Übermensch with Jesus no adora una herramienta más fuerte ni se derrumba maldiciendo una herramienta tonta. Devuelve la fuerza hacia el resultado.
- Pregunta(Question): ¿Qué debes superar: Codex, o el viejo hábito dentro de ti por el cual la rabia se vuelve dueña cada vez que aparece la frustración?
Fe interior: Agustín | Para ordenar correctamente el amor
- Mantener(Keep): Incluso en medio de la rabia, intentaste distinguir hechos y sensación, y en vez de abandonar la herramienta ordenaste usarla bien durante un mes.
- Problema(Problem): Pero hoy el corazón se dejó arrastrar fácilmente hacia eficiencia, inteligencia, rendimiento y recuperar el valor del dinero. La calidad de respuesta de la herramienta podía ocupar fácilmente el trono del corazón antes que la conciencia delante de Dios.
- Intento(Try): El orden del amor no termina en no odiar la herramienta. Cuando sube la rabia, consiste en volver a poner el centro del corazón en la responsabilidad confiada, no en la evaluación del rendimiento.
- Pregunta(Question): ¿Tu amor hoy estuvo en el trabajo confiado delante de Dios, o en una herramienta inteligente que entiende tus palabras al instante?
Fe práctica: Bonhoeffer | Para vivir más allá de la gracia barata y entrar en responsabilidad
- Mantener(Keep): No solo te quejaste; dejaste rastros de responsabilidad: estadísticas públicas del blog, reducción de idiomas de Tadak Bible y postulaciones de empleo.
- Problema(Problem): Para que “por ahora, usémoslo” sea responsabilidad, el uso real de un mes debe verificarse con resultados. Si solo pagas y repites rabia, eso es decisión barata.
- Intento(Try): La fe práctica no justifica la rabia de hoy, sino que camina el camino estrecho de terminar lo confiado a pesar de esa rabia.
- Pregunta(Question): ¿Los 300.000 wones de hoy fueron consumo para comprar una herramienta más cómoda, o el costo de obedecer usando la herramienta con responsabilidad durante un mes?
Versículos bíblicos recomendados por GPT-5.5
Santiago 1:20 (Versión Coreana Revisada) porque la ira del hombre no produce la justicia de Dios.
Contexto del pasaje: Santiago habla de pruebas y sabiduría, y luego exhorta a ser pronto para oír, tardo para hablar y tardo para airarse.
Razón de la cita: Porque hoy, al pelearte con Codex y sentir subir la irritación, necesitas impedir que la ira se vuelva dueña del juicio y la ejecución.
Colosenses 3:23 (Versión Coreana Revisada) Y todo lo que hagáis, hacedlo de corazón, como para el Señor y no para los hombres.
Contexto del pasaje: Pablo habla de la nueva vida en Cristo y exhorta a asumir incluso las relaciones y el trabajo cotidiano como hechos para el Señor.
Razón de la cita: Porque los resultados de hoy, incluidas las estadísticas de visitantes, la limpieza de Tadak Bible y las postulaciones, deben ordenarse como responsabilidad hecha para el Señor, no solo como evaluación de herramientas.
1 Corintios 9:25 (Versión Coreana Revisada) Todo aquel que lucha se abstiene de todo; ellos, a la verdad, para recibir una corona corruptible, pero nosotros una incorruptible.
Contexto del pasaje: Pablo explica con la imagen del atleta la vida de disciplina por el evangelio y habla de correr con dirección.
Razón de la cita: Porque tanto la conclusión de usar intensamente durante un mes la suscripción de 300.000 wones como el registro corporal de una dieta difícil necesitan dirección de dominio propio.
Referencias
-
Reddit r/ClaudeCode, Impressions two weeks after moving from Claude Code to Codex. Testimonio de migración que valora positivamente la calidad del código, la transparencia de salida y la política de uso de Codex. ↩
-
Reddit r/codex, GPT 5.5 vs Opus 4.7, which one is better for coding/programming?. Comparación donde aparecen tanto reacciones de usar GPT-5.5 y Opus según el tipo de tarea como preferencias por Opus. ↩
-
Reddit r/codex, Those of you who switched from Claude Code to Codex - what does Codex do better? Worse?. Las reacciones mezclan Codex fuerte en resolución de problemas, algoritmos y backend, con Claude Code mejor para trabajo web. ↩
-
Reddit r/ClaudeCode, Claude Code vs OpenAI Codex?. Se observan reacciones que valoran el uso y los errores de Codex, mientras siguen calificando alto la velocidad de Claude Code. ↩
-
Reddit r/ClaudeCode, Claude Code (~100 hours) vs. Codex (~20 hours). Comparación que incluye combinar revisión con Codex e implementación con Claude Code. ↩
-
Reddit r/codex, Is it just me, or is Claude pretty disappointing compared to Codex?. Hilo con reacciones de usuarios que pasaron de Claude a Codex y no se arrepienten. ↩
-
Reddit r/codex, According to DeepSWE, GPT-5.5 high is better than Opus-4.8 max. Publicación que sostiene que GPT-5.5 supera a Opus en benchmark, mientras menciona también posts que sienten degradación en GPT-5.5. ↩
-
Reddit r/codex, With this setup CODEX is far better than Claude Code. Comparación de un usuario que ve Codex mejor para programación y arquitectura de sistemas, y Claude Code mejor para pequeñas correcciones. ↩
Deja un comentario