Los ocho hooks que garantizan la fiabilidad de un agente de IA
Las reglas de CLAUDE.md se siguen en torno al 80% de los casos. Los hooks se siguen el 100% de las veces. Tras seis meses probándolos, estos son los ocho que nunca he eliminado.
Análisis profundo de arquitectura de agentes IA, ingeniería de contexto y flujos de trabajo.
51 posts
Las reglas de CLAUDE.md se siguen en torno al 80% de los casos. Los hooks se siguen el 100% de las veces. Tras seis meses probándolos, estos son los ocho que nunca he eliminado.
Instalé tres extensiones populares de Claude Code y mi productividad apenas se movió. El problema nunca fue qué herramientas elegir.
Edité config.toml, escribí reglas en AGENTS.md y nada se aplicaba. El problema resultó ser la propia estructura de carpetas, no los ajustes.
El mismo día que Anthropic anunció Computer Use, OpenAI lanzó Codex como plugin de Claude Code. Creo que es la concesión más inteligente de 2026.
Hace un mes no podía separarme del portátil durante un build. Tres funciones en cuatro semanas lo solucionaron.
Pensé que con un solo archivo SKILL.md era suficiente. Luego vi cómo lo estructura el propio equipo de Anthropic y lo rehíce todo.
Pasé un fin de semana metiendo 100 MB de PDFs en un agente. El rendimiento empeoró. Clasificar lo que le estaba dando en cuatro categorías me mostró por qué.
Probé decenas de skills de diseño para agentes de IA que programan. La mayoría no duraron ni una semana. Estos 12 son los que sigo usando.
La repetición simple supera a los pipelines complejos. Un repaso a tres estrategias de bucle que están redefiniendo cómo los agentes de IA aprenden y mejoran en 2026.
Pasé un año obteniendo resultados erráticos con Claude Code y Codex. Tres archivos de especificaciones, cada uno con un rol distinto, lo resolvieron.
Que el agente escriba código es solo el principio. Para entender los PR y explicar la arquitectura, las herramientas de visualización son imprescindibles.
Suscribirse te pone en el top 0,3%. Estas cinco configuraciones —agentes, equipos, MCP, monitorización y automatización— te llevan al top 0,01%.
Clasificé todos los términos que me seguía encontrando al usar Claude Code y Codex a diario. Surgieron cinco grupos, y mapean todo el sistema sobre el que funcionan estas herramientas.
Revisé las definiciones de tipos del SDK y los system prompts de ambas herramientas. La diferencia entre 29 y 7 no tiene que ver con el número de funciones. Tiene que ver con dos respuestas fundamentalmente distintas a la misma pregunta: ¿cómo debería interactuar un agente de IA con tu sistema?
Tras un año de desarrollo asistido por agentes de IA, descubrí que los archivos de especificaciones estructurados resolvían el problema de inconsistencia mucho mejor que cualquier técnica de prompting.
Hice ingeniería inversa de cómo Codex gestiona el desbordamiento de contexto frente a Claude Code: cifrado AES, traspaso de sesión y trucos de KV cache.
El CEO de Shopify, Tobias, creó QMD, un motor de búsqueda open source. Al conectarlo a Claude Code, cada sesión obtiene memoria persistente.
El equipo de Claude Code de Anthropic reconstruyó sus herramientas tres veces. Menos herramientas hicieron que la IA rindiera mejor. Aquí van cuatro principios duramente aprendidos.
Tu IA no se vuelve más torpe con el tiempo. Es tu sesión principal la que está saturada. Los sub-agentes la mantienen ágil y precisa durante más de una hora.
Una condición de carrera entre Auto Memory y la compresión de contexto en Claude Code v2.1.59–v2.1.61 rompió la caché de prompts y corrompió las sesiones. Anthropic restableció los límites semanales de todos los usuarios como compensación.
Agentation proporciona a los agentes IA retroalimentación visual precisa mediante selectores CSS. Readout reproduce sesiones de Claude Code como un vídeo. Juntas eliminan los dos mayores puntos de fricción del desarrollo frontend asistido por IA.
Un conjunto de habilidades de context engineering de código abierto acaba de superar las 10k estrellas en GitHub. Después de aplicarlo a mi propio stack de agentes, por fin entiendo por qué fallan los agentes.
Cuando un agente repite la misma llamada fallida una y otra vez, revisar el código no sirve de nada. Las trazas son el nuevo código fuente para depurar agentes de IA.
Nuevos datos de benchmarks demuestran que los ficheros de contexto AGENTS.md y CLAUDE.md perjudican el rendimiento de los agentes de código. A veces la pereza es la mejor decisión de ingeniería.
Tres empresas actualizaron sus agentes de codificación casi al mismo tiempo. Las direcciones convergen. El campo de batalla real no es el modelo, sino la velocidad de absorción de los flujos de trabajo.
Del SaaSpocalypse al silicio dedicado por modelo, cinco predicciones audaces sobre hacia dónde se dirige la IA en 2026, con aproximadamente un 50 % de probabilidad de acertar.
Mis costes de API se multiplicaron por diez cuando el cache se rompió en producción. Ese mismo día, los ingenieros de Anthropic explicaron exactamente por qué.
Lo que demuestran los resultados de Terminal Bench de LangChain y el experimento con el formato hashline. El modelo fue el mismo, y la razón por la que el ranking del leaderboard se invirtió fueron tres factores: el prompt, las herramientas y el middleware.
Desde Markdown for Agents de Cloudflare y Vercel hasta WebMCP de Google: lectura y escritura se estandarizan simultáneamente, inaugurando la era del Agent-Native Web.
Cinco principios de redacción del body SKILL.md enterrados en la documentación oficial de Anthropic. Desde la separación de roles description/body hasta los bucles de verificación.
La incorporación de Peter Steinberger a OpenAI no es solo captación de talento. La IA está redefiniendo las apps de mensajería: análisis de esta transformación global.
El equipo Codex de OpenAI construyó una base de código de un millón de líneas usando solo agentes de IA. Estos son los cinco principios de harness engineering que descubrieron.
Guia practica sobre los equipos multiagente de Claude Code: activacion, atajos de teclado, compatibilidad de terminal, gestion de tareas y limitaciones conocidas.
OpenAI y Google lanzan planes de IA asequibles mientras los competidores chinos hunden los precios. Te explicamos por qué este es tu mejor punto de entrada.
Tariq Shihipar de Anthropic revela las claves para construir agentes de producción - desde herramientas Bash-first hasta ingeniería de contexto basada en el sistema de archivos.
Anthropic lanza Cowork, un agente autónomo que lee, edita y crea archivos en tu máquina local. Del vibe coding al vibe working.
Por qué 300.000 millones de dólares se evaporaron del SaaS mientras ChatGPT y Claude compiten por ser la tienda de apps de la IA.
El flujo de trabajo de Boris Cherny alcanzo 5.000 likes en 2 horas. Su configuracion es mas sencilla de lo esperado - sesiones paralelas, modo plan, CLAUDE.md y bucles de verificacion.
La configuración de Claude Code de un ganador de hackathon de Anthropic tras 10 meses de uso: gestión de contexto, hooks, subagentes y los principios que importan de verdad.
Seis combinaciones de Skills de Claude Code que permiten a un equipo pequeño gestionar un negocio full-stack - desde marketing y vídeo hasta diseño UI y calidad de código.
Tras instalar cientos de Skills para agentes IA, solo 4 forman parte de mi día a día. Comparto el resultado de mi auditoría del fin de semana.
Claude Code renombró Todo a Task. Parece un cambio menor, pero marca el inicio de un sistema completamente nuevo, diseñado para enjambres de IA.
Una barra de estado estilo videojuego para Claude Code que muestra en tiempo real el uso de contexto, herramientas activas, subagentes y progreso de tareas.
Conectar Context7 vía MCP inunda tu contexto principal con documentación. Los Skills y subagentes aíslan las consultas, manteniendo estables las sesiones de programación largas.
La IA ya representa el 50 % de las lecturas de documentación y el tráfico de bots supera al humano en una proporción de 3 a 1. Los servicios se apresuran a empaquetar su conocimiento como skills.
Andrej Karpathy confiesa que nunca se había sentido tan rezagado como desarrollador. La nueva capa de abstracción de agentes IA que describe podría suponer una brecha de productividad de 10x.
El sistema de memoria basado en archivos detrás de la valoración de 2.500 millones de dólares de Manus es ahora un skill gratuito de Claude Code. He aquí por qué importa para todo desarrollador de agentes IA.
Manus compartio las lecciones aprendidas a base de golpes en la construccion de agentes IA en produccion - desde la degradacion del contexto hasta replantearse la evaluacion - en una presentacion conjunta con LangChain.
Meta adquirió Manus por 3.600 millones de dólares. El secreto no era un modelo más grande, sino la ingeniería de contexto. Esto es lo que la mayoría de los agentes de IA no entienden.
Anthropic reemplazó TodoWrite con Tasks y los Slash Commands con Skills en dos días. Ambos cambios apuntan en la misma dirección: quitar las cadenas al modelo.
Claude Code y las apps de avatares IA lo demuestran: los usuarios quieren resultados, no interfaces complejas. La era Zero UI se acerca mas rapido de lo que pensamos.