3 de marzo de 2026 5 min de lectura

Los Sub-Agentes de Claude Code Ahorran 25 Veces Menos Tokens en tu Sesión Principal

Tu IA no se vuelve más torpe con el tiempo. Es tu sesión principal la que está saturada. Los sub-agentes la mantienen ágil y precisa durante más de una hora.

Llevo un tiempo escuchando la misma queja: “Claude Code va empeorando cuanto más tiempo lo uso.”

La causa es casi siempre la misma. Todo —lecturas de archivos, búsquedas, exploración de código— se amontona en una única sesión principal. A medida que los tokens se acumulan en la ventana de contexto, la IA retiene la información del principio y del final, pero empieza a perder lo que queda enterrado en el medio. Si la sesión depende de una concatenación simple de mensajes en lugar de compactación, el contenido más antiguo puede eliminarse por completo.

Los sub-agentes cambian las reglas del juego. Al delegar el trabajo a procesos de agente independientes, los tokens que llegan a tu sesión principal pueden reducirse a una veinticincoava parte de lo que serían de otro modo. Sesiones que antes se degradaban a los 30 minutos ahora aguantan más de una hora con el mismo nivel de calidad.

Después de compartir este patrón con el equipo, las quejas desaparecieron.

Lo Que Llega a tu Sesión Principal Determina la Calidad de las Respuestas

Leer tres archivos directamente en la sesión principal vuelca más de 15.000 tokens de código fuente en bruto en tu contexto. Delegar el mismo trabajo a tres sub-agentes hace que cada uno devuelva un resumen de 200 tokens. Total: 600 tokens en la sesión principal.

Cuanto más crece la ventana de contexto, mejor gestiona la IA el principio y el final —pero peor gestiona la información del medio. Los investigadores de Stanford llaman a esto «Lost in the Middle»: la precisión en la recuperación de información situada en el centro de un contexto largo cae más de un 30 %.

Mantener la sesión principal ligera elimina este problema de raíz. Un compañero que antes veía cómo la calidad se deterioraba a los 30 minutos ahora hace sesiones de más de una hora sin ningún problema.

Exploración directa: más de 15.000 tokens en la sesión principal frente a resúmenes de agentes: 600 tokens
Los sub-agentes trabajan en contextos aislados y solo devuelven lo esencial
Un contexto principal más corto significa menos puntos ciegos en el centro
Techo de calidad a los 30 minutos → sesiones de más de 1 hora con la misma calidad

Empezar con Agentes General Malgasta Más Dinero

Hay cuatro tipos de agentes integrados.

Explore es de solo lectura y funciona con Haiku —rápido y económico—. Plan y General heredan el modelo de la sesión principal: si estás en Sonnet, usan Sonnet; si estás en Opus, usan Opus. Bash es exclusivamente para comandos de terminal.

Aquí está la trampa: mucha gente usa General para tareas que solo requieren lectura —exploración de código, análisis de estructura, búsqueda de patrones—. Pocos se dan cuenta de que Explore produce resultados prácticamente idénticos para esas tareas a una fracción del coste.

Explore (basado en Haiku) ahorra más de un 80 % frente a General
Usa General solo para trabajo de implementación; Explore se encarga del resto
Plan es para lecturas de amplio alcance como el análisis de arquitectura
Bash es para aislar ejecuciones de tests y builds

Un Solo Prompt, Tres Agentes en Paralelo, la Mitad del Tiempo de Incorporación

Las tareas independientes pueden ejecutarse de forma simultánea. Un único prompt como «Investiga el sistema de autenticación, el esquema de base de datos y las rutas de la API por separado» arranca tres agentes Explore a la vez.

Un nuevo miembro del equipo al que le enseñé este patrón terminó de entender la base de código en la mitad del tiempo. La única regla: nunca ejecutes agentes en paralelo que modifiquen el mismo archivo —van a entrar en conflicto.

Tareas independientes → en paralelo; tareas dependientes → en secuencia
Ediciones del mismo archivo en paralelo = conflictos garantizados
Añade «en paralelo» a tu prompt y Claude lo divide automáticamente
Tres resúmenes simultáneos ocupan aproximadamente 600 tokens en la sesión principal

Ctrl+B Te Permite Empezar la Siguiente Función Mientras Corren los Tests

Pulsa Ctrl+B y el agente actual pasa a segundo plano. Ejecuta toda la suite de tests mientras empiezas a construir la siguiente funcionalidad de inmediato. Sin esto, solo estás mirando una barra de progreso.

Los agentes en segundo plano no pueden hacer preguntas ni usar herramientas MCP. Solo tienen acceso de lectura y escritura de archivos —pero eso es suficiente para ejecutar tests y revisiones de código.

Ctrl+B envía el agente actual al segundo plano
Consulta los resultados más tarde: «¿Qué han devuelto los tests?»
Agentes en segundo plano: sin herramientas MCP, solo lectura/escritura de archivos
Ejecuta una revisión de código en segundo plano mientras sigues implementando

Un Solo Archivo de Agente Personalizado se Reutiliza en Cinco Herramientas

Crea un único archivo en .claude/agents/reviewer.md. Añade un frontmatter YAML con nombre, descripción y modelo —Claude Code lo detecta automáticamente y enruta las tareas correspondientes hacia él.

Este formato de archivo sigue el estándar de agentskills.io, lo que significa que los agentes que creas una vez funcionan en Cursor, Copilot, Codex y Gemini CLI sin ninguna modificación.

Ejecuta npx ai-agent-skills install code-review para descargar al instante 47 agentes prediseñados y validados.

Coloca un archivo markdown en .claude/agents/ → se detecta automáticamente
Establece model: haiku para revisiones económicas; usa opus o sonnet para auditorías de seguridad y comprobaciones de gestión de errores
Compatible con Claude Code, Cursor, Copilot y Codex

El Problema Real No Es que la IA Se Vuelva Más Torpe

Tu IA no está perdiendo capacidad. Tu sesión principal está acumulando demasiado contexto para que pueda verlo todo con claridad. Los sub-agentes no consisten en usar más IA —consisten en proteger el espacio donde tu IA piensa.

Únete al boletín

Recibe insights sobre la IA más reciente.