2026年3月3日 2 分鐘閱讀

Claude Code Sub-Agents 幫你節省主 Session 25 倍 Token

唔係 AI 愈用愈蠢。係你主 Session 已經超載。Sub-agents 令佢保持精簡，用多過一個鐘都唔出問題。

我成日聽到同一個投訴：「Claude Code 用耐咗就愈答愈差。」

原因幾乎每次都一樣。所有嘢——讀檔案、搜尋、探索程式碼——統統塞進一個主 session 入面。隨住 token 喺 context window 裏面愈積愈多，AI 對頭尾嘅資訊仲係記得，但中間嗰堆就開始漏。如果 session 係用簡單訊息串接而唔係壓縮嘅話，最早期嘅內容更會被直接刪走。

Sub-agents 就係改變規則嘅關鍵。將工作分派畀獨立嘅 agent 進程去做，落到主 session 嘅 token 可以跌到原本嘅二十五分之一。以前半個鐘開始退步嘅 session，而家可以保持同等質素撐過一個鐘以上。

將呢個方法分享畀團隊之後，投訴就消失晒。

主 Session 塞咗咩，直接決定答案質素

喺主 session 直接讀三個檔案，你就倒咗 15,000+ 個原始程式碼 token 入 context。同樣嘅工作交畀三個 sub-agents 去做，每個只係返回一個 200 token 嘅摘要。主 session 合計：600 token。

Context window 愈大，AI 對頭尾嘅處理愈好——但中間部分就愈麻煩。史丹福研究人員將呢個現象叫做「Lost in the Middle」：放喺長 context 中間嘅資訊，檢索準確率跌幅超過三成。

保持主 session 精簡，就係從結構上消除呢個問題。有個隊友以前三十分鐘後質素就開始下滑，而家一個鐘以上都唔出事。

內建有四種 agent 類型。

Explore 係唯讀模式，用 Haiku 運行——快而且平。Plan 同 General 繼承主 session 嘅模型：你用緊 Sonnet，佢哋就用 Sonnet；你用 Opus，佢哋就用 Opus。Bash 則只係處理終端指令。

陷阱喺呢度：好多人用 General 去做只需要讀嘢嘅任務——探索程式碼、分析結構、搜尋模式。但係少人知道，Explore 喺呢類工作上出嚟嘅結果幾乎一模一樣，費用卻係零頭。

獨立任務可以同時跑。一個「分別調查 auth 系統、資料庫 schema 同 API 路由」嘅 prompt，會同時啟動三個 Explore agents。

有個新加入嘅隊友跟住呢個方法學，了解整個程式碼庫嘅時間縮短咗一半。唯一嘅規則：唔好同時跑會修改同一個檔案嘅平行 agents——必定衝突。

按 Ctrl+B，當前 agent 移到後台。你可以跑完整測試套件，同時立即開始建構下一個功能。唔用呢個方法，你就係喺度盯住進度條發呆。

後台 agents 唔可以問問題，亦唔可以使用 MCP 工具。佢哋只有讀寫檔案嘅權限——但跑測試同做程式碼審查已經夠用。

喺 .claude/agents/reviewer.md 建立一個檔案。加一個包含 name、description 同 model 嘅 YAML frontmatter——Claude Code 會自動偵測，並將匹配嘅任務路由過去。

呢個檔案格式跟隨 agentskills.io 標準，即係話你建好嘅 agents 無需修改，就可以直接喺 Cursor、Copilot、Codex 同 Gemini CLI 使用。

跑 npx ai-agent-skills install code-review 即刻下載 47 個預建、經過審核嘅 agents。

AI 嘅能力冇流失。係你主 session 積聚咗太多 context，令佢睇唔晒所有嘢。Sub-agents 唔係要用更多 AI——係要保護你 AI 思考嘅空間。

獲取最新 AI 洞見。