# Los Sub-Agentes de Claude Code Ahorran 25 Veces Más Tokens en tu Sesión Principal

> Author: Tony Lee
> Published: 2026-03-03
> URL: https://tonylee.im/es-LA/blog/claude-code-subagents-save-25x-tokens-main-session/
> Reading time: 5 minutes
> Language: es-LA
> Tags: claude-code, ai-agents, context-engineering, productivity, ai

## Description

Tu IA no se está volviendo más tonta. Tu sesión principal está sobrecargada. Los sub-agentes la mantienen ágil y precisa por más de una hora.

## Content

Siempre escucho la misma queja: "Claude Code se pone peor mientras más tiempo lo uso."

La causa es casi siempre la misma. Todo — lecturas de archivos, búsquedas, exploración de código — se amontona en una sola sesión principal. A medida que los tokens se acumulan en la ventana de contexto, la IA retiene información del principio y del final, pero empieza a perderse lo que está enterrado en el medio. Si la sesión depende de simple concatenación de mensajes en lugar de compactación, el contenido más antiguo puede eliminarse por completo.

Los sub-agentes cambian la ecuación. Al delegar trabajo a procesos de agentes independientes, los tokens que llegan a tu sesión principal pueden caer a un veinticinco por ciento de lo que serían de otra forma. Sesiones que antes se degradaban a los 30 minutos ahora aguantan más de una hora al mismo nivel de calidad.

Después de compartir este patrón con el equipo, las quejas desaparecieron.

## Lo que Llega a tu Sesión Principal Determina la Calidad de las Respuestas

Leer tres archivos directamente en la sesión principal significa volcar más de 15,000 tokens de código fuente crudo en tu contexto. Delegar el mismo trabajo a tres sub-agentes, y cada uno regresa un resumen de 200 tokens. Total: 600 tokens en la sesión principal.

Cuanto más grande crece la ventana de contexto, mejor maneja la IA el principio y el final — pero peor maneja la información del medio. Investigadores de Stanford llaman a esto "Lost in the Middle": la precisión de recuperación de información colocada en el medio de un contexto largo cae más del 30%.

Mantener la sesión principal ágil elimina este problema de forma estructural. Un compañero de equipo que antes veía degradarse la calidad a los 30 minutos ahora corre sesiones de más de una hora sin problemas.

- **Exploración en línea**: más de 15,000 tokens en la sesión principal vs. **resúmenes de agentes**: 600 tokens
- Los sub-agentes trabajan en contexto aislado y solo devuelven lo esencial
- Un contexto principal más corto significa menos puntos ciegos en el medio
- Techo de calidad de 30 minutos → sesiones de más de 1 hora al mismo nivel

## Empezar con Agentes General Desperdicia el Dinero Más Rápido

Hay cuatro tipos de agentes integrados.

**Explore** es de solo lectura y corre en Haiku — rápido y económico. **Plan** y **General** heredan el modelo de la sesión principal: si estás en Sonnet, usan Sonnet; si en Opus, Opus. **Bash** es únicamente para comandos de terminal.

El problema es este: mucha gente usa General para tareas que solo requieren lectura — exploración de código, análisis de estructura, búsqueda de patrones. Pocos se dan cuenta de que Explore produce resultados prácticamente idénticos para esas tareas a una fracción del costo.

- Explore (basado en Haiku) ahorra más del 80% comparado con General
- Usa General solo para trabajo de implementación; Explore se encarga del resto
- Plan es para lecturas de amplio alcance como análisis de arquitectura
- Bash es para aislar ejecuciones de pruebas y builds

## Un Prompt, Tres Agentes en Paralelo, la Mitad del Tiempo de Onboarding

Las tareas independientes pueden correr de forma concurrente. Un solo prompt como "Investiga el sistema de autenticación, el esquema de base de datos y las rutas de API por separado" levanta tres agentes Explore al mismo tiempo.

Un compañero nuevo al que le enseñé este patrón terminó de entender la base de código en la mitad del tiempo. La única regla: nunca corras agentes en paralelo que modifiquen el mismo archivo — van a generar conflictos.

- Tareas independientes → en paralelo; tareas dependientes → en secuencia
- Ediciones al mismo archivo en paralelo = conflictos garantizados
- Agrega "en paralelo" a tu prompt y Claude lo divide automáticamente
- Tres resúmenes concurrentes ocupan aproximadamente 600 tokens en la sesión principal

## Ctrl+B te Permite Empezar la Siguiente Funcionalidad Mientras Corren las Pruebas

Presiona Ctrl+B y el agente actual se va al fondo. Corre tu suite completa de pruebas mientras de inmediato empiezas a construir la siguiente funcionalidad. Sin esto, solo estás mirando una barra de progreso.

Los agentes en segundo plano no pueden hacer preguntas y no pueden usar herramientas MCP. Solo tienen acceso de lectura y escritura de archivos — pero eso es suficiente para ejecuciones de pruebas y revisiones de código.

- Ctrl+B envía el agente actual al segundo plano
- Revisa los resultados después: "¿Qué devolvieron las pruebas?"
- Agentes en segundo plano: sin herramientas MCP, solo lectura y escritura de archivos
- Corre revisiones de código en segundo plano mientras sigues implementando

## Un Archivo de Agente Personalizado se Reutiliza en Cinco Herramientas

Crea un solo archivo en `.claude/agents/reviewer.md`. Agrega un frontmatter YAML con nombre, descripción y modelo — Claude Code lo detecta automáticamente y enruta las tareas que coincidan hacia él.

Este formato de archivo sigue el estándar de agentskills.io, lo que significa que los agentes que construyes una sola vez funcionan en Cursor, Copilot, Codex y Gemini CLI sin modificaciones.

Corre `npx ai-agent-skills install code-review` para descargar al instante 47 agentes preconfigurados y validados.

- Coloca un archivo markdown en `.claude/agents/` → se detecta automáticamente
- Configura `model: haiku` para revisiones económicas; usa `opus` o `sonnet` para auditorías de seguridad y revisiones de manejo de errores
- Compatible con Claude Code, Cursor, Copilot y Codex

## El Problema Real No es que la IA se Vuelva Más Tonta

Tu IA no está perdiendo capacidad. Tu sesión principal está acumulando demasiado contexto para que pueda ver todo con claridad. Los sub-agentes no se tratan de usar más IA — se tratan de proteger el espacio donde tu IA piensa.

---

Author: Tony Lee | Website: https://tonylee.im
For more articles, visit: https://tonylee.im/es-LA/blog/
This content is original and authored by Tony Lee. Please attribute when quoting or referencing.