Revisé las definiciones de tipos del SDK y los system prompts de ambas herramientas. La diferencia entre 29 y 7 no tiene que ver con el número de funciones. Tiene que ver con dos respuestas fundamentalmente distintas a la misma pregunta: ¿cómo debería interactuar un agente de IA con tu sistema?
Alguien benchmarkeó una reimplementación de SQLite en Rust escrita íntegramente por un LLM. La brecha entre código que parece correcto y código que realmente lo es resultó ser de cinco órdenes de magnitud.
Hice ingeniería inversa de cómo Codex gestiona el desbordamiento de contexto frente a Claude Code: cifrado AES, traspaso de sesión y trucos de KV cache.
El equipo de Claude Code de Anthropic reconstruyó sus herramientas tres veces. Menos herramientas hicieron que la IA rindiera mejor. Aquí van cuatro principios duramente aprendidos.
No podía dormir después de que me señalaran que publicaba demasiado poco. A las 3 de la madrugada empecé a programar free-router, una herramienta que detecta modelos de IA gratuitos en tiempo real y los conecta a tus herramientas de código con una sola tecla.
Cuando los agentes generan 3.000 commits al día, los humanos no pueden revisarlos todos. Así se construye un pipeline de verificación automática que detecta lo que las personas no pueden.
Nuevos datos de benchmarks demuestran que los ficheros de contexto AGENTS.md y CLAUDE.md perjudican el rendimiento de los agentes de código. A veces la pereza es la mejor decisión de ingeniería.
Tres empresas actualizaron sus agentes de codificación casi al mismo tiempo. Las direcciones convergen. El campo de batalla real no es el modelo, sino la velocidad de absorción de los flujos de trabajo.
Las cinco predicciones de Thomas Wolf sobre cómo la IA transformará radicalmente la arquitectura del software. Desde el fin de las dependencias hasta los lenguajes diseñados para IA.
El equipo Codex de OpenAI construyó una base de código de un millón de líneas usando solo agentes de IA. Estos son los cinco principios de harness engineering que descubrieron.
Mientras el mercado alerta sobre el exceso de GPU, OpenAI insiste: necesitamos más capacidad de cómputo. La verdadera batalla no es de potencia, sino de experiencia de usuario.
En 2026, la gramática de las startups está cambiando. El rol del fundador pasa de escribir código a orquestar la IA - y el criterio es la nueva profundidad técnica.