Claude Code 子代理讓主對話節省 25 倍的 Token 用量
AI 不是越用越笨。是你的主對話累積了太多脈絡。子代理能讓它保持精簡,連續使用超過一小時也不失準。
我一直聽到同樣的抱怨:「Claude Code 用越久越不準。」
原因幾乎都一樣。所有事情——讀檔案、搜尋、探索程式碼——全都塞進同一個主對話。隨著 token 在上下文視窗裡不斷累積,AI 對開頭和結尾的資訊還記得住,但夾在中間的內容就開始漏掉了。如果對話只是單純把訊息串接起來而沒有壓縮機制,最早的內容甚至可能被直接丟棄。
子代理改變了這個局面。把工作分派給獨立的代理程序後,落入主對話的 token 數量可以降到原本的二十五分之一。以前用三十分鐘就開始退步的對話,現在能在同樣的品質水準下撐超過一個小時。
把這個模式分享給團隊之後,那些抱怨就消失了。
主對話裡放什麼,決定了回答的品質
直接在主對話裡讀三個檔案,你就把一萬五千多個 token 的原始碼倒進上下文。把同樣的事交給三個子代理,每個只回傳兩百個 token 的摘要。加起來:主對話裡只有六百個 token。
上下文視窗越長,AI 對開頭和結尾的掌握越好——但對夾在中間的資訊處理越差。史丹佛研究人員將這個現象稱為「迷失在中間」(Lost in the Middle):放在長脈絡中段的資訊,檢索準確率會下降超過 30%。
讓主對話保持精簡,從根本上解決了這個問題。一位以前用三十分鐘就感覺品質下降的隊友,現在能連續使用超過一小時都沒問題。
- 直接探索:主對話裡一萬五千多個 token vs. 代理摘要:六百個 token
- 子代理在獨立的上下文中運作,只回傳關鍵資訊
- 主對話越短,中段的盲點就越少
- 三十分鐘品質天花板 → 同等品質下使用超過一小時
一開始就用 General 代理,是最燒錢的選擇
內建的代理類型有四種。
Explore 是唯讀的,跑在 Haiku 上——速度快、成本低。Plan 和 General 繼承主對話的模型設定:如果你用的是 Sonnet,它們就用 Sonnet;如果是 Opus,就用 Opus。Bash 則專門用來執行終端機指令。
陷阱在這裡:很多人用 General 做只需要讀取的事——程式碼探索、結構分析、模式搜尋。很少人知道,Explore 在這些任務上能跑出幾乎一樣的結果,費用卻只是一小部分。
- Explore(基於 Haiku)比 General 省下超過 80% 的費用
- General 只用在實作工作;其他的讓 Explore 來
- Plan 適合大範圍閱讀,像是架構分析
- Bash 適合測試執行和建置隔離
一個提示詞、三個平行代理,新人上手時間減半
獨立的任務可以同時進行。一個提示詞像是「分別調查驗證系統、資料庫結構和 API 路由」,就能同時啟動三個 Explore 代理。
我教了這個模式給一位新加入的團隊成員,他理解程式碼庫的時間縮短了一半。唯一的規則:絕對不要讓同時執行的代理修改同一個檔案——它們會衝突。
- 獨立的任務 → 平行執行;有相依性的任務 → 依序執行
- 平行執行時編輯同一個檔案 = 必定衝突
- 在提示詞裡加上「同時」,Claude 會自動拆分任務
- 三個同時執行的摘要,在主對話裡大約只佔六百個 token
Ctrl+B 讓你在跑測試的同時開始做下一個功能
按下 Ctrl+B,目前的代理就移到背景執行。你可以在跑完整測試套件的同時,立刻開始開發下一個功能。少了這個,你就只是在盯著進度條發呆。
背景代理不能提問,也不能使用 MCP 工具。它們只有檔案讀寫的權限——但對於跑測試和程式碼審查來說,這樣就夠了。
- Ctrl+B 把目前的代理送到背景
- 之後再問:「測試的結果怎樣?」
- 背景代理:沒有 MCP 工具,只有檔案讀寫
- 在背景跑程式碼審查,同時繼續實作
一個自訂代理檔案,可以在五個工具上重複使用
在 .claude/agents/reviewer.md 建立一個檔案。加上包含名稱、描述和模型的 YAML frontmatter——Claude Code 會自動偵測它,並將符合條件的任務路由到它。
這個檔案格式遵循 agentskills.io 的標準,這表示你建好的代理不需要任何修改,就能在 Cursor、Copilot、Codex 和 Gemini CLI 上運作。
執行 npx ai-agent-skills install code-review,可以立刻下載 47 個預先建好、經過驗證的代理。
- 把 markdown 檔案放進
.claude/agents/→ 自動偵測 - 便宜的審查設定
model: haiku;安全性稽核和錯誤處理檢查則用opus或sonnet - 相容 Claude Code、Cursor、Copilot 和 Codex
真正的問題不是 AI 越來越笨
你的 AI 沒有失去能力。是你的主對話累積了太多上下文,讓它看不清楚全局。子代理的重點不是用更多 AI——而是保護你的 AI 思考的空間。
訂閱電子報
獲取關於我最新專案、文章以及 AI 和 Web 開發實驗的更新。