Ocho hooks que garantizan la confiabilidad de un agente de IA
Las reglas en CLAUDE.md se siguen más o menos el 80% del tiempo. Los hooks se siguen el 100%. Después de seis meses probando, estos son los ocho que nunca saqué.
Análisis profundo de arquitectura de agentes IA, ingeniería de contexto y flujos de trabajo.
50 posts
Las reglas en CLAUDE.md se siguen más o menos el 80% del tiempo. Los hooks se siguen el 100%. Después de seis meses probando, estos son los ocho que nunca saqué.
Instalé tres extensiones populares de Claude Code y mi productividad casi no cambió. El problema nunca fue cuáles herramientas elegir.
Edité config.toml, escribí reglas en AGENTS.md y nada se aplicaba. El problema resultó ser la estructura de carpetas en sí, no mis configuraciones.
El mismo día que Anthropic anunció Computer Use, OpenAI lanzó Codex como plugin de Claude Code. Creo que es la concesión más inteligente de 2026.
Hace un mes no podía alejarme de la laptop durante un build. Tres funciones en cuatro semanas lo solucionaron.
Pensé que con un solo archivo SKILL.md era suficiente. Luego vi cómo lo estructura el propio equipo de Anthropic y lo reconstruí todo.
Pasé un fin de semana metiendo 100MB de PDFs en un agente. El rendimiento empeoró. Mapear lo que le estaba dando en cuatro categorías me mostró exactamente por qué.
Probé docenas de skills de diseño para agentes de AI coding. La mayoría no duraron una semana. Estos 12 son los que sigo usando.
Pasé un año obteniendo resultados erráticos con Claude Code y Codex. Tres archivos de especificaciones, cada uno con un rol distinto, lo resolvieron.
Que el agente escriba código es solo el inicio. Para entender los PR y explicar la arquitectura a los compañeros, las herramientas de visualización son esenciales.
Suscribirte te pone en el top 0.3%. Estas cinco configuraciones — agentes, equipos, MCP, monitoreo, automatización — te llevan al top 0.01%.
Clasifiqué cada término que me seguía apareciendo mientras usaba Claude Code y Codex a diario. Surgieron cinco grupos que mapean todo el sistema en el que operan estas herramientas.
Revisé las definiciones de tipos del SDK y los system prompts de ambas herramientas. La diferencia 29 vs 7 no se trata de cantidad de funciones. Se trata de dos respuestas fundamentalmente distintas a la misma pregunta: ¿cómo debería interactuar un agente de IA con tu sistema?
Después de un año de desarrollo asistido por agentes de IA, descubrí que los archivos de especificaciones estructurados resolvían el problema de inconsistencia mucho mejor que cualquier técnica de prompting.
Hice ingeniería inversa de cómo Codex maneja el desbordamiento de contexto. La respuesta involucra cifrado AES, patrones de session handover y trucos de KV cache.
El CEO de Shopify, Tobias, creó QMD, un motor de búsqueda open source. Al conectarlo a Claude Code, cada sesión obtiene memoria persistente.
El equipo de Claude Code de Anthropic reconstruyó sus herramientas tres veces. Menos herramientas hicieron que la IA rindiera mejor. Aquí van cuatro principios aprendidos a pulso.
Tu IA no se está volviendo más tonta. Tu sesión principal está sobrecargada. Los sub-agentes la mantienen ágil y precisa por más de una hora.
Una condición de carrera entre Auto Memory y la compresión de contexto en Claude Code v2.1.59–v2.1.61 rompió el caché de prompts y corrompió las sesiones. Anthropic reseteó los límites semanales de todos los usuarios como compensación.
Agentation le da a los agentes de IA retroalimentación visual precisa con selectores CSS. Readout reproduce sesiones de Claude Code como video. Juntas eliminan los dos mayores puntos de fricción del desarrollo frontend con IA.
Un conjunto de habilidades de context engineering de código abierto acaba de superar las 10k estrellas en GitHub. Después de aplicarlo en mi propio stack de agentes, finalmente entiendo por qué fallan los agentes.
Cuando un agente repite la misma llamada fallida una y otra vez, revisar el código no sirve de nada. Los traces son el nuevo código fuente para debuguear agentes de IA.
Datos recientes de benchmarks muestran que los archivos de contexto AGENTS.md y CLAUDE.md en realidad perjudican el rendimiento de los agentes de código. A veces la flojera es la mejor decisión de ingeniería.
Tres empresas actualizaron sus agentes de codificación casi al mismo tiempo. Las direcciones convergen. El campo de batalla real no es el modelo, sino la velocidad de absorción de los flujos de trabajo.
Del SaaSpocalypse al silicio dedicado por modelo, cinco predicciones audaces sobre hacia dónde va la IA en 2026, con más o menos un 50 % de probabilidad de pegarle.
Mis costos de API se multiplicaron por 10 cuando el cache se rompió en producción. El mismo día, los ingenieros de Anthropic explicaron exactamente por qué.
Lo que demuestran los resultados de Terminal Bench de LangChain y el experimento con el formato hashline. El modelo fue el mismo, y la razón por la que el ranking del leaderboard se invirtió fueron tres factores: el prompt, las herramientas y el middleware.
Desde Markdown for Agents de Cloudflare y Vercel hasta WebMCP de Google: lectura y escritura se estandarizan a la vez, dando inicio a la era del Agent-Native Web.
Cinco principios de escritura del body SKILL.md escondidos en la documentación oficial de Anthropic. Desde separar los roles de description y body hasta los loops de verificación.
Peter Steinberger en OpenAI no es solo una contratación. La IA está redefiniendo las apps de mensajería: análisis de esta transformación global.
El equipo Codex de OpenAI construyó un código base de un millón de líneas usando solo agentes de IA. Estos son los cinco principios de harness engineering que descubrieron.
Guía práctica sobre la nueva función de equipos multiagente en Claude Code: activación, atajos de teclado, compatibilidad de terminal, gestión de tareas y limitaciones conocidas.
OpenAI y Google lanzan planes de IA accesibles mientras los competidores chinos derrumban los precios. Te explicamos por qué este es tu mejor punto de entrada.
Tariq Shihipar de Anthropic revela las claves para construir agentes de producción - desde herramientas Bash-first hasta ingeniería de contexto basada en el sistema de archivos.
Anthropic lanza Cowork, un agente autónomo que lee, edita y crea archivos en tu computadora. Del vibe coding al vibe working.
Por qué se evaporaron $300B del SaaS mientras ChatGPT y Claude compiten por ser la app store de la IA, y qué nos dice la guerra móvil de 2008.
El flujo de trabajo de Boris Cherny alcanzo 5,000 likes en 2 horas. Su configuracion es mas simple de lo esperado - sesiones paralelas, modo plan, CLAUDE.md y ciclos de verificacion.
La configuración de Claude Code de un ganador de hackathon de Anthropic tras 10 meses de uso diario - gestión de contexto, hooks, subagentes y los principios que de verdad importan.
Seis combinaciones de Skills de Claude Code que le permiten a un equipo pequeño operar un negocio full-stack - desde marketing y video hasta diseño de UI y calidad de código.
Después de instalar cientos de Skills para agentes IA, solo 4 quedaron en mi flujo diario. Comparto el resultado de mi auditoría del fin de semana.
Claude Code renombró Todo a Task. Parece un cambio menor, pero marca el inicio de un sistema completamente nuevo, diseñado para enjambres de IA.
Una barra de estado estilo videojuego para Claude Code que muestra en tiempo real el uso de contexto, herramientas activas, subagentes y progreso de tareas.
Conectar Context7 por MCP inunda tu contexto principal con documentación. Los Skills y subagentes aíslan las consultas, manteniendo estables las sesiones largas de programación.
La IA ya representa el 50% de las lecturas de documentación y el tráfico de bots supera al humano 3 a 1. Los servicios se apuran a empaquetar su conocimiento como skills.
Andrej Karpathy confiesa que nunca se había sentido tan rezagado como desarrollador. La nueva capa de abstracción de agentes de IA que describe podría significar una brecha de productividad de 10x.
El sistema de memoria basado en archivos detrás de la valuación de 2,500 millones de dólares de Manus ahora es un skill gratuito de Claude Code. Esto es lo que significa para los desarrolladores de agentes de IA.
Manus compartió las lecciones más duras detrás de construir agentes de IA en producción - desde la degradación de contexto hasta replantear la evaluación - en una presentación conjunta con LangChain.
Meta adquirió Manus por 3,600 millones de dólares. El secreto no era un modelo más grande, sino la ingeniería de contexto. Esto es lo que la mayoría de los agentes de IA no ven.
Anthropic reemplazó TodoWrite con Tasks y los Comandos Slash con Skills en dos días. Ambos cambios apuntan en la misma dirección - liberando al modelo.
Claude Code y las apps de avatares IA lo demuestran: los usuarios quieren resultados, no interfaces complejas. La era Zero UI se acerca mas rapido de lo que pensamos.