# Claude Code Sub-Agents 幫你節省主 Session 25 倍 Token > Author: Tony Lee > Published: 2026-03-03 > URL: https://tonylee.im/zh-HK/blog/claude-code-subagents-save-25x-tokens-main-session/ > Reading time: 2 minutes > Language: zh-HK > Tags: claude-code, ai-agents, context-engineering, productivity, ai ## Description 唔係 AI 愈用愈蠢。係你主 Session 已經超載。Sub-agents 令佢保持精簡,用多過一個鐘都唔出問題。 ## Content 我成日聽到同一個投訴:「Claude Code 用耐咗就愈答愈差。」 原因幾乎每次都一樣。所有嘢——讀檔案、搜尋、探索程式碼——統統塞進一個主 session 入面。隨住 token 喺 context window 裏面愈積愈多,AI 對頭尾嘅資訊仲係記得,但中間嗰堆就開始漏。如果 session 係用簡單訊息串接而唔係壓縮嘅話,最早期嘅內容更會被直接刪走。 Sub-agents 就係改變規則嘅關鍵。將工作分派畀獨立嘅 agent 進程去做,落到主 session 嘅 token 可以跌到原本嘅二十五分之一。以前半個鐘開始退步嘅 session,而家可以保持同等質素撐過一個鐘以上。 將呢個方法分享畀團隊之後,投訴就消失晒。 ## 主 Session 塞咗咩,直接決定答案質素 喺主 session 直接讀三個檔案,你就倒咗 15,000+ 個原始程式碼 token 入 context。同樣嘅工作交畀三個 sub-agents 去做,每個只係返回一個 200 token 嘅摘要。主 session 合計:600 token。 Context window 愈大,AI 對頭尾嘅處理愈好——但中間部分就愈麻煩。史丹福研究人員將呢個現象叫做「Lost in the Middle」:放喺長 context 中間嘅資訊,檢索準確率跌幅超過三成。 保持主 session 精簡,就係從結構上消除呢個問題。有個隊友以前三十分鐘後質素就開始下滑,而家一個鐘以上都唔出事。 - **直接探索**:主 session 15,000+ token,對比 **agent 摘要**:600 token - Sub-agents 喺獨立 context 運作,只回傳精華內容 - 主 context 愈短,中段盲點就愈少 - 三十分鐘質素天花板 → 一個鐘以上保持同等質素 ## 一開始就用 General Agents 係最燒錢嘅做法 內建有四種 agent 類型。 **Explore** 係唯讀模式,用 Haiku 運行——快而且平。**Plan** 同 **General** 繼承主 session 嘅模型:你用緊 Sonnet,佢哋就用 Sonnet;你用 Opus,佢哋就用 Opus。**Bash** 則只係處理終端指令。 陷阱喺呢度:好多人用 General 去做只需要讀嘢嘅任務——探索程式碼、分析結構、搜尋模式。但係少人知道,Explore 喺呢類工作上出嚟嘅結果幾乎一模一樣,費用卻係零頭。 - Explore(基於 Haiku)比 General 慳超過八成 - General 只用喺實際實作工作;其餘用 Explore 就夠 - Plan 適合大範圍閱讀,好似架構分析咁 - Bash 用嚟跑測試同隔離建構 ## 一個 Prompt、三個平行 Agents、入門時間減半 獨立任務可以同時跑。一個「分別調查 auth 系統、資料庫 schema 同 API 路由」嘅 prompt,會同時啟動三個 Explore agents。 有個新加入嘅隊友跟住呢個方法學,了解整個程式碼庫嘅時間縮短咗一半。唯一嘅規則:唔好同時跑會修改同一個檔案嘅平行 agents——必定衝突。 - 獨立任務 → 平行;有依賴嘅任務 → 順序執行 - 同一個檔案平行修改 = 必然衝突 - Prompt 入面加「平行」,Claude 會自動分拆 - 三個同時跑嘅摘要,主 session 大約只用 600 token ## Ctrl+B 讓你喺測試跑緊嗰陣已經開始做下一個功能 按 Ctrl+B,當前 agent 移到後台。你可以跑完整測試套件,同時立即開始建構下一個功能。唔用呢個方法,你就係喺度盯住進度條發呆。 後台 agents 唔可以問問題,亦唔可以使用 MCP 工具。佢哋只有讀寫檔案嘅權限——但跑測試同做程式碼審查已經夠用。 - Ctrl+B 將當前 agent 送到後台 - 之後查看結果:「測試返回啲咩?」 - 後台 agents:無 MCP 工具,只得檔案讀寫 - 繼續實作嘅同時,後台跑緊程式碼審查 ## 一個自訂 Agent 檔案,五個工具都用得到 喺 `.claude/agents/reviewer.md` 建立一個檔案。加一個包含 name、description 同 model 嘅 YAML frontmatter——Claude Code 會自動偵測,並將匹配嘅任務路由過去。 呢個檔案格式跟隨 agentskills.io 標準,即係話你建好嘅 agents 無需修改,就可以直接喺 Cursor、Copilot、Codex 同 Gemini CLI 使用。 跑 `npx ai-agent-skills install code-review` 即刻下載 47 個預建、經過審核嘅 agents。 - 將 markdown 檔案放入 `.claude/agents/` → 自動偵測 - 一般審查設 `model: haiku` 慳錢;安全審計同錯誤處理檢查就用 `opus` 或 `sonnet` - 相容 Claude Code、Cursor、Copilot 同 Codex ## 真正嘅問題唔係 AI 變蠢咗 AI 嘅能力冇流失。係你主 session 積聚咗太多 context,令佢睇唔晒所有嘢。Sub-agents 唔係要用更多 AI——係要保護你 AI 思考嘅空間。 --- Author: Tony Lee | Website: https://tonylee.im For more articles, visit: https://tonylee.im/zh-HK/blog/ This content is original and authored by Tony Lee. Please attribute when quoting or referencing.