# Les sous-agents Claude Code économisent 25x les tokens de votre session principale

> Author: Tony Lee
> Published: 2026-03-03
> URL: https://tonylee.im/fr/blog/claude-code-subagents-save-25x-tokens-main-session/
> Reading time: 5 minutes
> Language: fr
> Tags: claude-code, ai-agents, context-engineering, productivity, ai

## Description

Votre IA ne devient pas plus bête. Votre session principale est surchargée. Les sous-agents la gardent légère et précise pendant plus d'une heure.

## Content

J'entends sans cesse la même plainte : « Claude Code se dégrade plus je l'utilise longtemps. »

La cause est presque toujours identique. Tout — lectures de fichiers, recherches, exploration du code — s'entasse dans une seule session principale. À mesure que les tokens s'accumulent dans la fenêtre de contexte, l'IA retient bien ce qui se trouve au début et à la fin, mais commence à rater ce qui est enfoui au milieu. Si la session repose sur une simple concaténation de messages plutôt que sur une compaction, le contenu le plus ancien peut même être supprimé entièrement.

Les sous-agents changent la donne. En déléguant le travail à des processus agents indépendants, les tokens qui atterrissent dans votre session principale peuvent tomber à un vingt-cinquième de ce qu'ils auraient été autrement. Des sessions qui se dégradaient au bout de 30 minutes tiennent désormais plus d'une heure au même niveau de qualité.

Depuis que j'ai partagé ce fonctionnement avec l'équipe, les plaintes ont disparu.

## Ce qui entre dans votre session principale détermine la qualité des réponses

Lisez trois fichiers directement dans la session principale, et vous déversez plus de 15 000 tokens de code source brut dans votre contexte. Déléguez le même travail à trois sous-agents, et chacun renvoie un résumé de 200 tokens. Total : 600 tokens dans la session principale.

Plus la fenêtre de contexte grossit, mieux l'IA gère le début et la fin — mais moins elle gère ce qui se trouve au milieu. Des chercheurs de Stanford appellent ce phénomène le « Lost in the Middle » : la précision de récupération des informations placées au milieu d'un long contexte chute de plus de 30 %.

Garder la session principale légère élimine ce problème de façon structurelle. Un collègue qui voyait la qualité se dégrader après 30 minutes fait maintenant tourner ses sessions plus d'une heure sans aucun problème.

- **Exploration en ligne** : 15 000+ tokens dans la session principale vs. **résumés des agents** : 600 tokens
- Les sous-agents travaillent dans un contexte isolé et ne renvoient que l'essentiel
- Un contexte principal plus court signifie moins de zones aveugles au milieu
- Plafond de qualité à 30 minutes → sessions de plus d'une heure au même niveau

## Commencer avec des agents General gaspille le plus d'argent

Il existe quatre types d'agents intégrés.

**Explore** est en lecture seule et tourne sur Haiku — rapide et économique. **Plan** et **General** héritent du modèle de la session principale : si vous êtes sur Sonnet, ils utilisent Sonnet ; si vous êtes sur Opus, ils utilisent Opus. **Bash** est réservé aux commandes terminal.

Voici le piège : beaucoup de gens utilisent General pour des tâches qui ne nécessitent que de la lecture — exploration de code, analyse de structure, recherche de patterns. Peu réalisent qu'Explore produit des résultats quasi identiques pour ces tâches à une fraction du coût.

- Explore (basé sur Haiku) économise plus de 80 % par rapport à General
- N'utilisez General que pour le travail d'implémentation ; Explore gère le reste
- Plan est fait pour les lectures à large périmètre comme l'analyse d'architecture
- Bash est pour l'isolation des tests et des builds

## Un seul prompt, trois agents en parallèle, deux fois moins de temps d'onboarding

Les tâches indépendantes peuvent tourner en parallèle. Un prompt unique comme « Analyse le système d'authentification, le schéma de base de données et les routes API séparément » lance trois agents Explore simultanément.

Un nouveau membre de l'équipe à qui j'ai enseigné cette approche a compris la base de code en deux fois moins de temps. La seule règle : ne jamais lancer des agents en parallèle qui modifient le même fichier — ils entreront en conflit.

- Tâches indépendantes → parallèle ; tâches dépendantes → séquentiel
- Des modifications sur le même fichier en parallèle = conflits garantis
- Ajoutez « en parallèle » à votre prompt et Claude sépare automatiquement
- Trois résumés simultanés occupent environ 600 tokens dans la session principale

## Ctrl+B vous permet de commencer la prochaine fonctionnalité pendant que les tests tournent

Appuyez sur Ctrl+B et l'agent actuel passe en arrière-plan. Lancez toute votre suite de tests pendant que vous commencez immédiatement à construire la prochaine fonctionnalité. Sans ça, vous ne faites que regarder une barre de progression.

Les agents en arrière-plan ne peuvent pas poser de questions et ne peuvent pas utiliser les outils MCP. Ils n'ont accès qu'à la lecture et à l'écriture de fichiers — mais c'est suffisant pour les exécutions de tests et les revues de code.

- Ctrl+B envoie l'agent actuel en arrière-plan
- Consultez les résultats plus tard : « Qu'ont renvoyé les tests ? »
- Agents en arrière-plan : pas d'outils MCP, lecture/écriture de fichiers uniquement
- Lancez une revue de code en arrière-plan pendant que vous continuez à implémenter

## Un seul fichier d'agent personnalisé réutilisé dans cinq outils

Créez un fichier unique dans `.claude/agents/reviewer.md`. Ajoutez un frontmatter YAML avec le nom, la description et le modèle — Claude Code le détecte automatiquement et y route les tâches correspondantes.

Ce format de fichier suit le standard agentskills.io, ce qui signifie que les agents que vous créez une seule fois fonctionnent dans Cursor, Copilot, Codex et Gemini CLI sans aucune modification.

Exécutez `npx ai-agent-skills install code-review` pour télécharger instantanément 47 agents pré-construits et validés.

- Déposez un fichier markdown dans `.claude/agents/` → détection automatique
- Définissez `model: haiku` pour des revues économiques ; utilisez `opus` ou `sonnet` pour les audits de sécurité et les vérifications de gestion des erreurs
- Compatible avec Claude Code, Cursor, Copilot et Codex

## Le vrai problème, ce n'est pas une IA qui devient plus bête

Votre IA ne perd pas en capacité. Votre session principale accumule trop de contexte pour qu'elle puisse tout voir clairement. Les sous-agents ne consistent pas à utiliser plus d'IA — ils consistent à protéger l'espace dans lequel votre IA réfléchit.

---

Author: Tony Lee | Website: https://tonylee.im
For more articles, visit: https://tonylee.im/fr/blog/
This content is original and authored by Tony Lee. Please attribute when quoting or referencing.