2026年3月3日 1 分鐘閱讀 2026

Claude Code 子代理讓主對話節省 25 倍的 Token 用量

AI 不是越用越笨。是你的主對話累積了太多脈絡。子代理能讓它保持精簡，連續使用超過一小時也不失準。

我一直聽到同樣的抱怨：「Claude Code 用越久越不準。」

原因幾乎都一樣。所有事情——讀檔案、搜尋、探索程式碼——全都塞進同一個主對話。隨著 token 在上下文視窗裡不斷累積，AI 對開頭和結尾的資訊還記得住，但夾在中間的內容就開始漏掉了。如果對話只是單純把訊息串接起來而沒有壓縮機制，最早的內容甚至可能被直接丟棄。

子代理改變了這個局面。把工作分派給獨立的代理程序後，落入主對話的 token 數量可以降到原本的二十五分之一。以前用三十分鐘就開始退步的對話，現在能在同樣的品質水準下撐超過一個小時。

把這個模式分享給團隊之後，那些抱怨就消失了。

主對話裡放什麼，決定了回答的品質

直接在主對話裡讀三個檔案，你就把一萬五千多個 token 的原始碼倒進上下文。把同樣的事交給三個子代理，每個只回傳兩百個 token 的摘要。加起來：主對話裡只有六百個 token。

上下文視窗越長，AI 對開頭和結尾的掌握越好——但對夾在中間的資訊處理越差。史丹佛研究人員將這個現象稱為「迷失在中間」（Lost in the Middle）：放在長脈絡中段的資訊，檢索準確率會下降超過 30%。

讓主對話保持精簡，從根本上解決了這個問題。一位以前用三十分鐘就感覺品質下降的隊友，現在能連續使用超過一小時都沒問題。

內建的代理類型有四種。

Explore 是唯讀的，跑在 Haiku 上——速度快、成本低。Plan 和 General 繼承主對話的模型設定：如果你用的是 Sonnet，它們就用 Sonnet；如果是 Opus，就用 Opus。Bash 則專門用來執行終端機指令。

陷阱在這裡：很多人用 General 做只需要讀取的事——程式碼探索、結構分析、模式搜尋。很少人知道，Explore 在這些任務上能跑出幾乎一樣的結果，費用卻只是一小部分。

獨立的任務可以同時進行。一個提示詞像是「分別調查驗證系統、資料庫結構和 API 路由」，就能同時啟動三個 Explore 代理。

我教了這個模式給一位新加入的團隊成員，他理解程式碼庫的時間縮短了一半。唯一的規則：絕對不要讓同時執行的代理修改同一個檔案——它們會衝突。

按下 Ctrl+B，目前的代理就移到背景執行。你可以在跑完整測試套件的同時，立刻開始開發下一個功能。少了這個，你就只是在盯著進度條發呆。

背景代理不能提問，也不能使用 MCP 工具。它們只有檔案讀寫的權限——但對於跑測試和程式碼審查來說，這樣就夠了。

在 .claude/agents/reviewer.md 建立一個檔案。加上包含名稱、描述和模型的 YAML frontmatter——Claude Code 會自動偵測它，並將符合條件的任務路由到它。

這個檔案格式遵循 agentskills.io 的標準，這表示你建好的代理不需要任何修改，就能在 Cursor、Copilot、Codex 和 Gemini CLI 上運作。

執行 npx ai-agent-skills install code-review，可以立刻下載 47 個預先建好、經過驗證的代理。

你的 AI 沒有失去能力。是你的主對話累積了太多上下文，讓它看不清楚全局。子代理的重點不是用更多 AI——而是保護你的 AI 思考的空間。

獲取最新 AI 洞見。