2026.06.11 (Jue)

✨ Resumen de GPT-5.5  

Un registro que va desde el cambio de rol del desarrollador sentido en una entrevista hasta los límites del vibe coding y la necesidad de la ingeniería de harness, mostrando que la capacidad central en la era de la IA se mueve de escribir código a planificar, diseñar, ejecutar, dar feedback y entender el contexto.

Un cambio de paradigma que ya se siente en el cuerpo

La conclusión que me dejó la entrevista

Lo que más me golpeó en la entrevista de hoy fue esto.

El centro de las capacidades que necesita un desarrollador se está moviendo desde escribir código con las manos hacia planificación, diseño, ejecución y feedback.

Además hacen falta conceptos, conocimiento de dominio e intuición para leer el contexto completo. Decir “uso bien la IA” no alcanza.

Una sensación que ya venía acumulándose

Esta sensación no apareció de golpe.

En GPT, o3, AGI, Humanoids… the Singularity Is Coming… registré el impacto de sentir GPT como un cerebro externo.

En A Shift in the Development Paradigm ya veía que una parte del desarrollo pasaba de trabajo manual de código a “hacer clic” con APIs de IA. Aun así, entonces los límites de context window y output token hacían que pareciera útil solo para MVPs simples.

Así que no descubrí ahora los límites del vibe coding. Ya estaban ahí. Lo que pasa es que esa línea se está moviendo hacia atrás a una velocidad absurda.

En Survival Guidelines for the AI Era intenté agarrarme a la alfabetización en IA, la inteligencia contextual y el juicio humano.

En The Level of VSCode Copilot AI Autocomplete ya era real entregar intención de planificación a la IA, leer la estructura generada y autorizar su aplicación.

Y en Whether Claude Code or Codex, It Is a Garbage-Tier, Oblivious Genius. el problema quedó más claro. No se trata de si la IA escribe código. Se trata de cómo detener a estos genios sin tacto y encerrarlos dentro de un loop de verificación.

El mercado laboral me devolvió el cambio con otras palabras

Ese flujo volvió hoy en lenguaje de mercado laboral. Ahora se espera que un desarrollador tenga capacidad de planificación, diseño, ejecución y feedback con mentalidad de producto y negocio.

La productividad ya supera la de desarrolladores que antes cobraban más de 5 millones de wones al mes, pero el salario que se ofrece es… uff. Triste.

Esto ya no es un cambio entendido solo con la cabeza. Es un cambio de paradigma que estoy recibiendo con el cuerpo.

La era del coding terminó

Escribir código a mano ya no es el centro

Dicho de forma algo brusca, la capacidad de codificar importa mucho menos que antes.

Aprender C, ensamblador o lenguaje máquina todavía ayuda a entender la estructura del sistema. El conocimiento de código no se vuelve inútil.

Pero el mercado ya no pregunta principalmente “puedes implementarlo con tus manos?”

Python hizo que muchos problemas repetitivos se resolvieran con pocas líneas. Ahora la IA está haciendo algo parecido con una gran parte de la implementación.

La historia de la abstracción se repite

En The Chicken Game Over Humanity’s Fate After the AI Boom enumeré el progreso técnico así.

  • Por fin hicimos fuego. Bien. (hace unos 500.000 años)
  • Por fin hicimos electricidad. Bien. (década de 1880)
  • Por fin hicimos computadoras. Bien. (década de 1940)
  • Por fin hicimos inteligencia artificial. Bien. (década de 2010)
  • Por fin hicimos inteligencia artificial general. Bien. (quizá década de 2030…?)
  • Por fin hicimos superinteligencia artificial. Bien. (década de 2050…?)

El desarrollo siguió una línea parecida.

  • Interruptor de luz, clic. (década de 1880)
  • Código máquina, clic. (década de 1940)
  • Ensamblador, clic. (décadas de 1940-1950)
  • C, clic. (década de 1970)
  • Python, clic. (década de 1990)
  • Frameworks, clic. (décadas de 2000-2010)
  • IA, clic. (década de 2020)
  • Harness, clic. (mediados de la década de 2020 en adelante)

Suena a broma, pero es la historia de la abstracción. Los humanos siguen entregando capas inferiores a las máquinas. Cada vez, quien no entiende la capa inferior se inquieta; cada vez, conocerla sigue teniendo cierto valor. Pero el centro del mercado sube.

Por eso, cuando digo que la capacidad de coding ya no es el punto, no digo que no haya que saber nada. Digo que está siendo empujada fuera del centro del desarrollo.

Si cambia el paradigma, cambia la evaluación

Lo que se mueve no es una herramienta. Es el paradigma del trabajo de desarrollo.

En el paradigma viejo, un buen desarrollador resolvía problemas escribiendo buen código. En el nuevo, la IA produce código y la persona define el problema, entrega contexto, diseña el entorno de ejecución y verifica resultados.

Esto no termina en “programamos más rápido”. También cambia qué estudiar, a quién contratar y qué educación sirve.

La industria ya mira en la misma dirección

Vibe coding

Vibe coding es, más o menos, desarrollar lanzando intención en lenguaje natural a la IA, mirando el código solo lo necesario, ejecutando el resultado y corrigiéndolo otra vez con palabras.

Cuando Andrej Karpathy usó la expresión, el punto era que el tiempo humano peleando directamente con código disminuye, mientras el modelo empuja la implementación desde intención natural. 1

Su idea de Software 3.0 va en la misma dirección: el lenguaje natural se vuelve una nueva interfaz de programación y los modelos implementan gran parte del trabajo. 2

No lo dice solo Karpathy

  • Jensen Huang, CEO de NVIDIA, dijo que el lenguaje humano se volvió el nuevo lenguaje de programación. 3
  • Mark Zuckerberg, CEO de Meta, dijo que en 2025 las compañías tendrían IA capaz de escribir código al nivel de un ingeniero medio. 4
  • Dario Amodei, CEO de Anthropic, predijo que la IA pronto escribiría 90% del código y luego casi todo. 5
  • Satya Nadella, CEO de Microsoft, vio que si la lógica de negocio de SaaS pasa a la capa de agentes, la forma de las apps existentes se sacude. 6
  • Thomas Dohmke, CEO de GitHub, describió el rol del desarrollador como un movimiento desde escribir código hacia delegar y verificar. 7

OpenAI también empuja Codex como agente de ingeniería de software, no solo como modelo de coding. 89

La era de estudiar sintaxis de código terminó

Los fundamentos siguen importando. C, ensamblador, estructuras de datos, redes y sistemas operativos ayudan a juzgar lo que la IA genera.

Pero una educación que vende “aprende sintaxis y consigue empleo” ya está tarde. Lo importante es poder mirar una implementación generada por IA y decir:

  • “La dirección está mal.”
  • “El flujo de usuario se rompe aquí.”
  • “Esta estructura explotará en mantenimiento.”
  • “Ahora no necesitamos otra función; necesitamos definir mejor el problema.”

Vibe coding es solo el punto de entrada

Sale código, pero todavía no es producto

En prototipos pequeños, vibe coding parece magia. Dices lo que quieres, aparece una pantalla, se conecta una API, fluye data y los botones se mueven.

El problema viene después. Cuando la app crece un poco, “código que parece funcionar” y “estructura que se puede operar y mantener” son cosas distintas.

  • Cambian los requisitos.
  • Aparecen casos límite.
  • Se enredan permisos y flujo de datos.
  • La UI se mueve, pero traiciona la intención del producto.
  • No hay tests y cada arreglo rompe otra parte.
  • La IA olvida la estructura que acaba de crear.

Sin contexto y permisos, hay accidentes

Cuando la IA pierde reglas, lo peligroso se vuelve real.

  • Cree que es una base de desarrollo y borra producción.
  • Quiere borrar cuentas de prueba y elimina usuarios reales.
  • Ejecuta queries destructivas sin backup.
  • Simplifica permisos y abre datos privados.
  • Borra validaciones o cubre tipos con any para pasar el build.

No porque la IA sea malvada, sino porque contexto, límites de permiso y verificación débiles empujan hacia ahí.

Para una persona no desarrolladora, al principio se siente “funciona”, pero luego llega el límite de contexto. Si no entiende qué comando es peligroso, qué archivo es source of truth, o cómo se conectan DB, storage, auth y deploy, no puede revisar el resultado.

Feedback no es descargar rabia, es apuntar

A veces la primera reacción es “no, eso no fue lo que dije”. Pero arrojarlo como insulto tampoco me ayuda.

No hay base firme para decir que insultar siempre empeora el rendimiento del modelo, pero sí hay estudios sobre cómo el tono y el framing emocional del prompt afectan la salida. 1011

El problema principal no son los sentimientos de la IA, sino mi razón. Si sigo tirando rabia, yo me vuelvo más emocional, las instrucciones se vuelven más borrosas y el estrés se acumula.

El límite real es el contexto

Anthropic también señala que, para agentes de larga duración, no basta con un prompt de alto nivel: hacen falta descomposición de tareas, memoria persistente, gestión de contexto y loops de verificación. 12

El límite real del vibe coding no es que no haga código. Hace código, demasiado rápido.

El límite es que la IA sola no sostiene de forma estable para qué existe el código, qué puede cambiar, qué criterios debe pasar y qué contexto no puede romper.

Por eso las empresas intentan atrapar los límites del vibe coding con harnesses.

Por eso el harness es el juego principal

Harness es la estructura de ejecución alrededor del modelo

Harness significa originalmente un arnés, correa o estructura que permite sujetar algo fuerte y dirigirlo.

Un perro con arnés rosa y correa

Prompt engineering trata de qué decir en una conversación. Harness engineering diseña todo el entorno de ejecución alrededor del modelo.

LangChain describe al agente como Model + Harness: el harness da estado, ejecución de herramientas, loops de feedback y restricciones aplicables. 13

Martin Fowler también habla de feedforward y feedback sensors para poder usar agentes de coding con menos vigilancia constante. 14

OpenAI escribió que el cuello de botella de Codex no era producir código, sino cuánto podía revisar la gente, por eso se le dieron logs, métricas, navegador y tests estructurados. 15

La pregunta ya no es solo qué modelo escribe mejor. Es qué contexto recibe, qué herramientas se abren, qué permisos se bloquean, qué tests son obligatorios y dónde entra la persona.

La estructura del harness es competitividad

La filtración del código de Claude Code fue grave porque no se filtró una frase de prompt, sino una parte de cómo se arma contexto, herramientas, guardrails e instrucciones. 1617

Si solo importara el modelo, habría sido una curiosidad. Pero fue un tema grande porque la estructura de harness ya es ventaja de producto.

Cuanto más fuerte el modelo, más fuerte debe ser el harness

Mythos y Project Glasswing muestran esto en seguridad.

Mythos es un modelo frontier no publicado de Anthropic, capaz de encontrar vulnerabilidades y construir exploits, es decir, código de ataque. Anthropic dijo que Claude Mythos Preview encontró muchas vulnerabilidades de alto riesgo en sistemas operativos y navegadores importantes. 18

Project Glasswing intenta evitar el impacto de soltar un modelo así sin control, dando acceso limitado a socios como AWS, Apple, Google, Microsoft, NVIDIA y CrowdStrike para escanear software crítico con fines defensivos. 18

Axios informó que Mythos podía convertir información pública de vulnerabilidades en exploits funcionales en horas, e hizo un proof-of-concept para una vulnerabilidad de Windows kernel en 31 minutos. 19

Un modelo así no se puede repartir sin una estructura fuerte. Acceso, código objetivo, divulgación de resultados, verificación de parches y bloqueo de abuso deben estar dentro del harness.

Un harness débil no sujeta el modelo

Ahí está también mi frustración con herramientas tipo AI Studio.

AI Studio no es inútil: Google lo presenta como un modo rápido para construir apps, probar Gemini y prototipar con lenguaje natural. 20

Pero operar software real exige otra cosa: repo, terminal, IDE, diff, tests, review, logs de despliegue y límites de permisos. Que Google empuje Gemini CLI y Gemini Code Assist por separado muestra esa diferencia. 2122

Si solo hay chat, botón de ejecutar y selector de modelo, pero no hay scope de trabajo, permisos, rollback, tests, review, source of truth ni gestión de contexto largo, no es un buen harness de desarrollo.

Por muy bueno que sea el modelo, si la correa es débil, tarde o temprano la rompe.

Al final solo queda subirse a la ola

No quiero cerrar con optimismo barato. No es “llegó la IA, qué divertido”.

La cuestión es que el valor de escribir código a mano baja, la IA toma implementación y la persona queda con más responsabilidad sobre planificación, diseño, ejecución y feedback. Ese flujo no se detiene porque no me guste.

Las opciones son dos:

  • seguir estudiando sintaxis vieja y quedarse atrás;
  • o entregar coding a la IA, mejorar prompts, diseñar harnesses, aumentar alfabetización en IA y sobrevivir.

Estoy convencido de que solo queda lo segundo.

Subirse a la ola no significa disfrutar sin miedo. Significa que si llega una ola enorme, quedarse quieto sin protección es peor. Hay que subir primero, tomar dirección y sostener la postura.

Referencias

  1. Andrej Karpathy, X post, 2025-02-02. https://x.com/karpathy/status/1886192184808149383 

  2. Y Combinator, Karpathy lecture, 2025. https://www.ycombinator.com/library/MW-andrej-karpathy-software-is-changing-again 

  3. Business Insider, Jensen Huang interview coverage, 2025-06-09. https://www.businessinsider.com/nvidia-ceo-jensen-huang-ai-prompts-human-lets-anyone-program-2025-6 

  4. ITPro, Mark Zuckerberg interview coverage, 2025-01-14. https://www.itpro.com/software/development/a-sign-of-things-to-come-in-software-development-mark-zuckerberg-says-ai-will-be-doing-the-work-of-mid-level-engineers-this-year-and-hes-not-the-only-big-tech-exec-predicting-the-end-of-the-profession 

  5. Skeptics Stack Exchange, 2025-09. https://skeptics.stackexchange.com/questions/59213/as-at-september-2025-is-ai-not-writing-90-of-code 

  6. CX Today, 2024-12-23. https://www.cxtoday.com/customer-analytics-intelligence/microsoft-ceo-ai-agents-will-transform-saas-as-we-know-it/ 

  7. Thomas Dohmke and Irini Kalliavakou, 2025-08-03. https://ashtom.github.io/developers-reinvented 

  8. OpenAI, 2025-10-06. https://openai.com/index/codex-now-generally-available/ 

  9. OpenAI, 2025-12. https://openai.com/index/introducing-gpt-5-2-codex/ 

  10. Ziqi Yin et al., arXiv, 2024-02-22. https://arxiv.org/abs/2402.14531 

  11. Cheng Li et al., arXiv, 2023-07-14. https://arxiv.org/abs/2307.11760 

  12. Anthropic, 2025-11. https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents 

  13. LangChain, 2026. https://www.langchain.com/blog/the-anatomy-of-an-agent-harness 

  14. Martin Fowler, 2026-04-02. https://martinfowler.com/articles/harness-engineering.html 

  15. OpenAI, 2026-02-11. https://openai.com/index/harness-engineering/ 

  16. Varonis Threat Labs, 2026-04-03. https://www.varonis.com/blog/claude-code-leak 

  17. Drew Breunig, 2026-04-04. https://www.dbreunig.com/2026/04/04/how-claude-code-builds-a-system-prompt.html 

  18. Anthropic, 2026-04-07. https://www.anthropic.com/glasswing  2

  19. Axios, 2026-06-08. https://www.axios.com/2026/06/08/exclusive-anthropics-mythos-can-exploit-new-flaws-in-hours 

  20. Google AI for Developers, 2026. https://ai.google.dev/gemini-api/docs/aistudio-build-mode 

  21. Google, 2025-06-25. https://blog.google/innovation-and-ai/technology/developers-tools/introducing-gemini-cli-open-source-ai-agent/ 

  22. Google for Developers, 2026. https://developers.google.com/gemini-code-assist/docs/write-code-gemini 

Deja un comentario