# Claude Code 子代理让主会话节省 25 倍 Token

> Author: Tony Lee
> Published: 2026-03-03
> URL: https://tonylee.im/zh-CN/blog/claude-code-subagents-save-25x-tokens-main-session/
> Reading time: 1 minutes
> Language: zh-CN
> Tags: claude-code, ai-agents, context-engineering, productivity, ai

## Description

AI 并没有变笨，是主会话超载了。用子代理保持上下文精简，让高质量对话持续超过一小时。

## Content

我一直听到同一种抱怨："用 Claude Code 的时间越长，它就越来越差。"

原因几乎都一样。所有操作——读文件、搜索、探索代码——全都堆在同一个主会话里。随着 token 不断累积，上下文窗口越来越臃肿，AI 能记住开头和结尾的内容，却开始遗漏埋在中间的信息。如果会话依赖简单的消息拼接而非压缩机制，最早的内容甚至会被直接丢弃。

子代理改变了这个局面。把工作分发给独立的代理进程处理，最终落入主会话的 token 可以降到原来的二十五分之一。以前用 30 分钟就开始退化的会话，现在能以同样的质量维持超过一小时。

把这个方法分享给团队之后，那些抱怨就消失了。

## 主会话里装了什么，决定了回答的质量

直接在主会话里读三个文件，你就往上下文里塞了 15,000 个以上的原始代码 token。把同样的工作交给三个子代理，每个代理只返回一份 200 token 的摘要。合计：主会话里只有 600 个 token。

上下文窗口越大，AI 处理开头和结尾的能力越强——但处理中间信息的能力却越差。斯坦福的研究人员称之为"迷失在中间"（Lost in the Middle）：放在长上下文中间位置的信息，检索准确率会下降 30% 以上。

保持主会话精简，从结构上消除了这个问题。一个以前 30 分钟后就开始质量下滑的同事，现在能流畅运行超过一小时的会话而没有任何问题。

- **直接探索**：主会话 15,000+ token vs. **代理摘要**：600 token
- 子代理在独立上下文中工作，只返回关键信息
- 主会话越短，上下文中间的盲点就越少
- 30 分钟质量上限 → 同等质量下可持续 1 小时以上

## 一上来就用 General 代理，最浪费钱

内置的代理类型有四种。

**Explore** 是只读模式，运行在 Haiku 上——速度快、成本低。**Plan** 和 **General** 继承主会话的模型：如果你用的是 Sonnet，它们就用 Sonnet；如果是 Opus，就用 Opus。**Bash** 专门用于终端命令。

问题就在这里：很多人用 General 来做只需要读取的任务——代码探索、结构分析、模式搜索。很少有人意识到，对于这些任务，Explore 能产出几乎相同的结果，成本却只是一小部分。

- Explore（基于 Haiku）比 General 节省 80% 以上
- General 只用于实现工作；其余的交给 Explore
- Plan 适合架构分析这类需要大范围读取的任务
- Bash 用于隔离运行测试和构建

## 一个提示词，三个并行代理，上手时间减半

独立的任务可以并发执行。一个提示词，比如"分别调查认证系统、数据库结构和 API 路由"，就能同时启动三个 Explore 代理。

我教了一个新团队成员这个方法，他理解整个代码库所花的时间缩短了一半。唯一的规则：永远不要让并行代理修改同一个文件——那会产生冲突。

- 独立任务 → 并行；依赖任务 → 串行
- 并行编辑同一文件 = 必然冲突
- 在提示词里加上"并行"，Claude 会自动拆分
- 三个并发摘要在主会话中大约只占 600 个 token

## Ctrl+B 让你在跑测试的同时开始下一个功能

按下 Ctrl+B，当前代理就移到后台运行。跑完整的测试套件的同时，你可以立即开始构建下一个功能。不用这个的话，你只能盯着进度条干等。

后台代理无法提问，也无法使用 MCP 工具。它们只有文件读写权限——但这对于跑测试和做代码审查已经足够了。

- Ctrl+B 将当前代理发送到后台
- 之后再查看结果："测试返回了什么？"
- 后台代理：没有 MCP 工具，只有文件读写
- 在后台做代码审查，同时继续开发

## 一个自定义代理文件，在五个工具里复用

在 `.claude/agents/reviewer.md` 创建一个文件，加上包含名称、描述和模型的 YAML 前置元数据——Claude Code 会自动识别，并将匹配的任务路由给它。

这种文件格式遵循 agentskills.io 标准，意味着你创建一次的代理，无需修改就能在 Cursor、Copilot、Codex 和 Gemini CLI 上使用。

运行 `npx ai-agent-skills install code-review`，可以立即下载 47 个预构建的、经过验证的代理。

- 把 markdown 文件放进 `.claude/agents/` → 自动识别
- 设置 `model: haiku` 用于低成本审查；安全审计和错误处理检查用 `opus` 或 `sonnet`
- 兼容 Claude Code、Cursor、Copilot 和 Codex

## 真正的问题不是 AI 变笨了

你的 AI 并没有失去能力。是你的主会话积累了太多上下文，导致它无法清晰地看到全貌。子代理不是为了用更多 AI——而是为了保护 AI 真正思考的那块空间。

---

Author: Tony Lee | Website: https://tonylee.im
For more articles, visit: https://tonylee.im/zh-CN/blog/
This content is original and authored by Tony Lee. Please attribute when quoting or referencing.