# Claude Code Sub-Agents 幫你節省主 Session 25 倍 Token

> Author: Tony Lee
> Published: 2026-03-03
> URL: https://tonylee.im/zh-HK/blog/claude-code-subagents-save-25x-tokens-main-session/
> Reading time: 2 minutes
> Language: zh-HK
> Tags: claude-code, ai-agents, context-engineering, productivity, ai

## Description

唔係 AI 愈用愈蠢。係你主 Session 已經超載。Sub-agents 令佢保持精簡，用多過一個鐘都唔出問題。

## Content

我成日聽到同一個投訴：「Claude Code 用耐咗就愈答愈差。」

原因幾乎每次都一樣。所有嘢——讀檔案、搜尋、探索程式碼——統統塞進一個主 session 入面。隨住 token 喺 context window 裏面愈積愈多，AI 對頭尾嘅資訊仲係記得，但中間嗰堆就開始漏。如果 session 係用簡單訊息串接而唔係壓縮嘅話，最早期嘅內容更會被直接刪走。

Sub-agents 就係改變規則嘅關鍵。將工作分派畀獨立嘅 agent 進程去做，落到主 session 嘅 token 可以跌到原本嘅二十五分之一。以前半個鐘開始退步嘅 session，而家可以保持同等質素撐過一個鐘以上。

將呢個方法分享畀團隊之後，投訴就消失晒。

## 主 Session 塞咗咩，直接決定答案質素

喺主 session 直接讀三個檔案，你就倒咗 15,000+ 個原始程式碼 token 入 context。同樣嘅工作交畀三個 sub-agents 去做，每個只係返回一個 200 token 嘅摘要。主 session 合計：600 token。

Context window 愈大，AI 對頭尾嘅處理愈好——但中間部分就愈麻煩。史丹福研究人員將呢個現象叫做「Lost in the Middle」：放喺長 context 中間嘅資訊，檢索準確率跌幅超過三成。

保持主 session 精簡，就係從結構上消除呢個問題。有個隊友以前三十分鐘後質素就開始下滑，而家一個鐘以上都唔出事。

- **直接探索**：主 session 15,000+ token，對比 **agent 摘要**：600 token
- Sub-agents 喺獨立 context 運作，只回傳精華內容
- 主 context 愈短，中段盲點就愈少
- 三十分鐘質素天花板 → 一個鐘以上保持同等質素

## 一開始就用 General Agents 係最燒錢嘅做法

內建有四種 agent 類型。

**Explore** 係唯讀模式，用 Haiku 運行——快而且平。**Plan** 同 **General** 繼承主 session 嘅模型：你用緊 Sonnet，佢哋就用 Sonnet；你用 Opus，佢哋就用 Opus。**Bash** 則只係處理終端指令。

陷阱喺呢度：好多人用 General 去做只需要讀嘢嘅任務——探索程式碼、分析結構、搜尋模式。但係少人知道，Explore 喺呢類工作上出嚟嘅結果幾乎一模一樣，費用卻係零頭。

- Explore（基於 Haiku）比 General 慳超過八成
- General 只用喺實際實作工作；其餘用 Explore 就夠
- Plan 適合大範圍閱讀，好似架構分析咁
- Bash 用嚟跑測試同隔離建構

## 一個 Prompt、三個平行 Agents、入門時間減半

獨立任務可以同時跑。一個「分別調查 auth 系統、資料庫 schema 同 API 路由」嘅 prompt，會同時啟動三個 Explore agents。

有個新加入嘅隊友跟住呢個方法學，了解整個程式碼庫嘅時間縮短咗一半。唯一嘅規則：唔好同時跑會修改同一個檔案嘅平行 agents——必定衝突。

- 獨立任務 → 平行；有依賴嘅任務 → 順序執行
- 同一個檔案平行修改 = 必然衝突
- Prompt 入面加「平行」，Claude 會自動分拆
- 三個同時跑嘅摘要，主 session 大約只用 600 token

## Ctrl+B 讓你喺測試跑緊嗰陣已經開始做下一個功能

按 Ctrl+B，當前 agent 移到後台。你可以跑完整測試套件，同時立即開始建構下一個功能。唔用呢個方法，你就係喺度盯住進度條發呆。

後台 agents 唔可以問問題，亦唔可以使用 MCP 工具。佢哋只有讀寫檔案嘅權限——但跑測試同做程式碼審查已經夠用。

- Ctrl+B 將當前 agent 送到後台
- 之後查看結果：「測試返回啲咩？」
- 後台 agents：無 MCP 工具，只得檔案讀寫
- 繼續實作嘅同時，後台跑緊程式碼審查

## 一個自訂 Agent 檔案，五個工具都用得到

喺 `.claude/agents/reviewer.md` 建立一個檔案。加一個包含 name、description 同 model 嘅 YAML frontmatter——Claude Code 會自動偵測，並將匹配嘅任務路由過去。

呢個檔案格式跟隨 agentskills.io 標準，即係話你建好嘅 agents 無需修改，就可以直接喺 Cursor、Copilot、Codex 同 Gemini CLI 使用。

跑 `npx ai-agent-skills install code-review` 即刻下載 47 個預建、經過審核嘅 agents。

- 將 markdown 檔案放入 `.claude/agents/` → 自動偵測
- 一般審查設 `model: haiku` 慳錢；安全審計同錯誤處理檢查就用 `opus` 或 `sonnet`
- 相容 Claude Code、Cursor、Copilot 同 Codex

## 真正嘅問題唔係 AI 變蠢咗

AI 嘅能力冇流失。係你主 session 積聚咗太多 context，令佢睇唔晒所有嘢。Sub-agents 唔係要用更多 AI——係要保護你 AI 思考嘅空間。

---

Author: Tony Lee | Website: https://tonylee.im
For more articles, visit: https://tonylee.im/zh-HK/blog/
This content is original and authored by Tony Lee. Please attribute when quoting or referencing.