Claude Code Sub-Agents 幫你節省主 Session 25 倍 Token
唔係 AI 愈用愈蠢。係你主 Session 已經超載。Sub-agents 令佢保持精簡,用多過一個鐘都唔出問題。
快速摘要
唔係 AI 愈用愈蠢。係你主 Session 已經超載。Sub-agents 令佢保持精簡,用多過一個鐘都唔出問題。
我成日聽到同一個投訴:「Claude Code 用耐咗就愈答愈差。」
原因幾乎每次都一樣。所有嘢——讀檔案、搜尋、探索程式碼——統統塞進一個主 session 入面。隨住 token 喺 context window 裏面愈積愈多,AI 對頭尾嘅資訊仲係記得,但中間嗰堆就開始漏。如果 session 係用簡單訊息串接而唔係壓縮嘅話,最早期嘅內容更會被直接刪走。
Sub-agents 就係改變規則嘅關鍵。將工作分派畀獨立嘅 agent 進程去做,落到主 session 嘅 token 可以跌到原本嘅二十五分之一。以前半個鐘開始退步嘅 session,而家可以保持同等質素撐過一個鐘以上。
將呢個方法分享畀團隊之後,投訴就消失晒。
主 Session 塞咗咩,直接決定答案質素
喺主 session 直接讀三個檔案,你就倒咗 15,000+ 個原始程式碼 token 入 context。同樣嘅工作交畀三個 sub-agents 去做,每個只係返回一個 200 token 嘅摘要。主 session 合計:600 token。
Context window 愈大,AI 對頭尾嘅處理愈好——但中間部分就愈麻煩。史丹福研究人員將呢個現象叫做「Lost in the Middle」:放喺長 context 中間嘅資訊,檢索準確率跌幅超過三成。
保持主 session 精簡,就係從結構上消除呢個問題。有個隊友以前三十分鐘後質素就開始下滑,而家一個鐘以上都唔出事。
- 直接探索:主 session 15,000+ token,對比 agent 摘要:600 token
- Sub-agents 喺獨立 context 運作,只回傳精華內容
- 主 context 愈短,中段盲點就愈少
- 三十分鐘質素天花板 → 一個鐘以上保持同等質素
一開始就用 General Agents 係最燒錢嘅做法
內建有四種 agent 類型。
Explore 係唯讀模式,用 Haiku 運行——快而且平。Plan 同 General 繼承主 session 嘅模型:你用緊 Sonnet,佢哋就用 Sonnet;你用 Opus,佢哋就用 Opus。Bash 則只係處理終端指令。
陷阱喺呢度:好多人用 General 去做只需要讀嘢嘅任務——探索程式碼、分析結構、搜尋模式。但係少人知道,Explore 喺呢類工作上出嚟嘅結果幾乎一模一樣,費用卻係零頭。
- Explore(基於 Haiku)比 General 慳超過八成
- General 只用喺實際實作工作;其餘用 Explore 就夠
- Plan 適合大範圍閱讀,好似架構分析咁
- Bash 用嚟跑測試同隔離建構
一個 Prompt、三個平行 Agents、入門時間減半
獨立任務可以同時跑。一個「分別調查 auth 系統、資料庫 schema 同 API 路由」嘅 prompt,會同時啟動三個 Explore agents。
有個新加入嘅隊友跟住呢個方法學,了解整個程式碼庫嘅時間縮短咗一半。唯一嘅規則:唔好同時跑會修改同一個檔案嘅平行 agents——必定衝突。
- 獨立任務 → 平行;有依賴嘅任務 → 順序執行
- 同一個檔案平行修改 = 必然衝突
- Prompt 入面加「平行」,Claude 會自動分拆
- 三個同時跑嘅摘要,主 session 大約只用 600 token
Ctrl+B 讓你喺測試跑緊嗰陣已經開始做下一個功能
按 Ctrl+B,當前 agent 移到後台。你可以跑完整測試套件,同時立即開始建構下一個功能。唔用呢個方法,你就係喺度盯住進度條發呆。
後台 agents 唔可以問問題,亦唔可以使用 MCP 工具。佢哋只有讀寫檔案嘅權限——但跑測試同做程式碼審查已經夠用。
- Ctrl+B 將當前 agent 送到後台
- 之後查看結果:「測試返回啲咩?」
- 後台 agents:無 MCP 工具,只得檔案讀寫
- 繼續實作嘅同時,後台跑緊程式碼審查
一個自訂 Agent 檔案,五個工具都用得到
喺 .claude/agents/reviewer.md 建立一個檔案。加一個包含 name、description 同 model 嘅 YAML frontmatter——Claude Code 會自動偵測,並將匹配嘅任務路由過去。
呢個檔案格式跟隨 agentskills.io 標準,即係話你建好嘅 agents 無需修改,就可以直接喺 Cursor、Copilot、Codex 同 Gemini CLI 使用。
跑 npx ai-agent-skills install code-review 即刻下載 47 個預建、經過審核嘅 agents。
- 將 markdown 檔案放入
.claude/agents/→ 自動偵測 - 一般審查設
model: haiku慳錢;安全審計同錯誤處理檢查就用opus或sonnet - 相容 Claude Code、Cursor、Copilot 同 Codex
真正嘅問題唔係 AI 變蠢咗
AI 嘅能力冇流失。係你主 session 積聚咗太多 context,令佢睇唔晒所有嘢。Sub-agents 唔係要用更多 AI——係要保護你 AI 思考嘅空間。
訂閱通訊
獲取關於我最新項目、文章同埋 AI 和 Web 開發實驗嘅更新。