目錄
2 分鐘閱讀

Claude Code Sub-Agents 幫你節省主 Session 25 倍 Token

唔係 AI 愈用愈蠢。係你主 Session 已經超載。Sub-agents 令佢保持精簡,用多過一個鐘都唔出問題。

快速摘要

唔係 AI 愈用愈蠢。係你主 Session 已經超載。Sub-agents 令佢保持精簡,用多過一個鐘都唔出問題。

我成日聽到同一個投訴:「Claude Code 用耐咗就愈答愈差。」

原因幾乎每次都一樣。所有嘢——讀檔案、搜尋、探索程式碼——統統塞進一個主 session 入面。隨住 token 喺 context window 裏面愈積愈多,AI 對頭尾嘅資訊仲係記得,但中間嗰堆就開始漏。如果 session 係用簡單訊息串接而唔係壓縮嘅話,最早期嘅內容更會被直接刪走。

Sub-agents 就係改變規則嘅關鍵。將工作分派畀獨立嘅 agent 進程去做,落到主 session 嘅 token 可以跌到原本嘅二十五分之一。以前半個鐘開始退步嘅 session,而家可以保持同等質素撐過一個鐘以上。

將呢個方法分享畀團隊之後,投訴就消失晒。

主 Session 塞咗咩,直接決定答案質素

喺主 session 直接讀三個檔案,你就倒咗 15,000+ 個原始程式碼 token 入 context。同樣嘅工作交畀三個 sub-agents 去做,每個只係返回一個 200 token 嘅摘要。主 session 合計:600 token。

Context window 愈大,AI 對頭尾嘅處理愈好——但中間部分就愈麻煩。史丹福研究人員將呢個現象叫做「Lost in the Middle」:放喺長 context 中間嘅資訊,檢索準確率跌幅超過三成。

保持主 session 精簡,就係從結構上消除呢個問題。有個隊友以前三十分鐘後質素就開始下滑,而家一個鐘以上都唔出事。

  • 直接探索:主 session 15,000+ token,對比 agent 摘要:600 token
  • Sub-agents 喺獨立 context 運作,只回傳精華內容
  • 主 context 愈短,中段盲點就愈少
  • 三十分鐘質素天花板 → 一個鐘以上保持同等質素

一開始就用 General Agents 係最燒錢嘅做法

內建有四種 agent 類型。

Explore 係唯讀模式,用 Haiku 運行——快而且平。PlanGeneral 繼承主 session 嘅模型:你用緊 Sonnet,佢哋就用 Sonnet;你用 Opus,佢哋就用 Opus。Bash 則只係處理終端指令。

陷阱喺呢度:好多人用 General 去做只需要讀嘢嘅任務——探索程式碼、分析結構、搜尋模式。但係少人知道,Explore 喺呢類工作上出嚟嘅結果幾乎一模一樣,費用卻係零頭。

  • Explore(基於 Haiku)比 General 慳超過八成
  • General 只用喺實際實作工作;其餘用 Explore 就夠
  • Plan 適合大範圍閱讀,好似架構分析咁
  • Bash 用嚟跑測試同隔離建構

一個 Prompt、三個平行 Agents、入門時間減半

獨立任務可以同時跑。一個「分別調查 auth 系統、資料庫 schema 同 API 路由」嘅 prompt,會同時啟動三個 Explore agents。

有個新加入嘅隊友跟住呢個方法學,了解整個程式碼庫嘅時間縮短咗一半。唯一嘅規則:唔好同時跑會修改同一個檔案嘅平行 agents——必定衝突。

  • 獨立任務 → 平行;有依賴嘅任務 → 順序執行
  • 同一個檔案平行修改 = 必然衝突
  • Prompt 入面加「平行」,Claude 會自動分拆
  • 三個同時跑嘅摘要,主 session 大約只用 600 token

Ctrl+B 讓你喺測試跑緊嗰陣已經開始做下一個功能

按 Ctrl+B,當前 agent 移到後台。你可以跑完整測試套件,同時立即開始建構下一個功能。唔用呢個方法,你就係喺度盯住進度條發呆。

後台 agents 唔可以問問題,亦唔可以使用 MCP 工具。佢哋只有讀寫檔案嘅權限——但跑測試同做程式碼審查已經夠用。

  • Ctrl+B 將當前 agent 送到後台
  • 之後查看結果:「測試返回啲咩?」
  • 後台 agents:無 MCP 工具,只得檔案讀寫
  • 繼續實作嘅同時,後台跑緊程式碼審查

一個自訂 Agent 檔案,五個工具都用得到

.claude/agents/reviewer.md 建立一個檔案。加一個包含 name、description 同 model 嘅 YAML frontmatter——Claude Code 會自動偵測,並將匹配嘅任務路由過去。

呢個檔案格式跟隨 agentskills.io 標準,即係話你建好嘅 agents 無需修改,就可以直接喺 Cursor、Copilot、Codex 同 Gemini CLI 使用。

npx ai-agent-skills install code-review 即刻下載 47 個預建、經過審核嘅 agents。

  • 將 markdown 檔案放入 .claude/agents/ → 自動偵測
  • 一般審查設 model: haiku 慳錢;安全審計同錯誤處理檢查就用 opussonnet
  • 相容 Claude Code、Cursor、Copilot 同 Codex

真正嘅問題唔係 AI 變蠢咗

AI 嘅能力冇流失。係你主 session 積聚咗太多 context,令佢睇唔晒所有嘢。Sub-agents 唔係要用更多 AI——係要保護你 AI 思考嘅空間。

訂閱通訊

獲取關於我最新項目、文章同埋 AI 和 Web 開發實驗嘅更新。