Mi Agente Llamó 5 Veces la Misma API Fallida — El Bug No Estaba en el Código
Cuando un agente repite la misma llamada fallida una y otra vez, revisar el código no sirve de nada. Los traces son el nuevo código fuente para debuguear agentes de IA.
Análisis profundo de arquitectura de agentes IA, ingeniería de contexto y flujos de trabajo.
29 posts
Cuando un agente repite la misma llamada fallida una y otra vez, revisar el código no sirve de nada. Los traces son el nuevo código fuente para debuguear agentes de IA.
Datos recientes de benchmarks muestran que los archivos de contexto AGENTS.md y CLAUDE.md en realidad perjudican el rendimiento de los agentes de código. A veces la flojera es la mejor decisión de ingeniería.
Tres empresas actualizaron sus agentes de codificación casi al mismo tiempo. Las direcciones convergen. El campo de batalla real no es el modelo, sino la velocidad de absorción de los flujos de trabajo.
Del SaaSpocalypse al silicio dedicado por modelo, cinco predicciones audaces sobre hacia dónde va la IA en 2026, con más o menos un 50 % de probabilidad de pegarle.
Mis costos de API se multiplicaron por 10 cuando el cache se rompió en producción. El mismo día, los ingenieros de Anthropic explicaron exactamente por qué.
Lo que demuestran los resultados de Terminal Bench de LangChain y el experimento con el formato hashline. El modelo fue el mismo, y la razón por la que el ranking del leaderboard se invirtió fueron tres factores: el prompt, las herramientas y el middleware.
Desde Markdown for Agents de Cloudflare y Vercel hasta WebMCP de Google: lectura y escritura se estandarizan a la vez, dando inicio a la era del Agent-Native Web.
Cinco principios de escritura del body SKILL.md escondidos en la documentación oficial de Anthropic. Desde separar los roles de description y body hasta los loops de verificación.
Peter Steinberger en OpenAI no es solo una contratación. La IA está redefiniendo las apps de mensajería: análisis de esta transformación global.
El equipo Codex de OpenAI construyó un código base de un millón de líneas usando solo agentes de IA. Estos son los cinco principios de harness engineering que descubrieron.
Guía práctica sobre la nueva función de equipos multiagente en Claude Code: activación, atajos de teclado, compatibilidad de terminal, gestión de tareas y limitaciones conocidas.
OpenAI y Google lanzan planes de IA accesibles mientras los competidores chinos derrumban los precios. Te explicamos por qué este es tu mejor punto de entrada.
Tariq Shihipar de Anthropic revela las claves para construir agentes de producción - desde herramientas Bash-first hasta ingeniería de contexto basada en el sistema de archivos.
Anthropic lanza Cowork, un agente autónomo que lee, edita y crea archivos en tu computadora. Del vibe coding al vibe working.
Por qué se evaporaron $300B del SaaS mientras ChatGPT y Claude compiten por ser la app store de la IA, y qué nos dice la guerra móvil de 2008.
El flujo de trabajo de Boris Cherny alcanzo 5,000 likes en 2 horas. Su configuracion es mas simple de lo esperado - sesiones paralelas, modo plan, CLAUDE.md y ciclos de verificacion.
La configuración de Claude Code de un ganador de hackathon de Anthropic tras 10 meses de uso diario - gestión de contexto, hooks, subagentes y los principios que de verdad importan.
Seis combinaciones de Skills de Claude Code que le permiten a un equipo pequeño operar un negocio full-stack - desde marketing y video hasta diseño de UI y calidad de código.
Después de instalar cientos de Skills para agentes IA, solo 4 quedaron en mi flujo diario. Comparto el resultado de mi auditoría del fin de semana.
Claude Code renombró Todo a Task. Parece un cambio menor, pero marca el inicio de un sistema completamente nuevo, diseñado para enjambres de IA.
Una barra de estado estilo videojuego para Claude Code que muestra en tiempo real el uso de contexto, herramientas activas, subagentes y progreso de tareas.
Conectar Context7 por MCP inunda tu contexto principal con documentación. Los Skills y subagentes aíslan las consultas, manteniendo estables las sesiones largas de programación.
La IA ya representa el 50% de las lecturas de documentación y el tráfico de bots supera al humano 3 a 1. Los servicios se apuran a empaquetar su conocimiento como skills.
Andrej Karpathy confiesa que nunca se había sentido tan rezagado como desarrollador. La nueva capa de abstracción de agentes de IA que describe podría significar una brecha de productividad de 10x.
El sistema de memoria basado en archivos detrás de la valuación de 2,500 millones de dólares de Manus ahora es un skill gratuito de Claude Code. Esto es lo que significa para los desarrolladores de agentes de IA.
Manus compartió las lecciones más duras detrás de construir agentes de IA en producción - desde la degradación de contexto hasta replantear la evaluación - en una presentación conjunta con LangChain.
Meta adquirió Manus por 3,600 millones de dólares. El secreto no era un modelo más grande, sino la ingeniería de contexto. Esto es lo que la mayoría de los agentes de IA no ven.
Anthropic reemplazó TodoWrite con Tasks y los Comandos Slash con Skills en dos días. Ambos cambios apuntan en la misma dirección - liberando al modelo.
Claude Code y las apps de avatares IA lo demuestran: los usuarios quieren resultados, no interfaces complejas. La era Zero UI se acerca mas rapido de lo que pensamos.