目錄
1 分鐘閱讀 Year 2026

Claude Code 子代理讓主對話節省 25 倍的 Token 用量

AI 不是越用越笨。是你的主對話累積了太多脈絡。子代理能讓它保持精簡,連續使用超過一小時也不失準。

快速摘要

AI 不是越用越笨。是你的主對話累積了太多脈絡。子代理能讓它保持精簡,連續使用超過一小時也不失準。

我一直聽到同樣的抱怨:「Claude Code 用越久越不準。」

原因幾乎都一樣。所有事情——讀檔案、搜尋、探索程式碼——全都塞進同一個主對話。隨著 token 在上下文視窗裡不斷累積,AI 對開頭和結尾的資訊還記得住,但夾在中間的內容就開始漏掉了。如果對話只是單純把訊息串接起來而沒有壓縮機制,最早的內容甚至可能被直接丟棄。

子代理改變了這個局面。把工作分派給獨立的代理程序後,落入主對話的 token 數量可以降到原本的二十五分之一。以前用三十分鐘就開始退步的對話,現在能在同樣的品質水準下撐超過一個小時。

把這個模式分享給團隊之後,那些抱怨就消失了。

主對話裡放什麼,決定了回答的品質

直接在主對話裡讀三個檔案,你就把一萬五千多個 token 的原始碼倒進上下文。把同樣的事交給三個子代理,每個只回傳兩百個 token 的摘要。加起來:主對話裡只有六百個 token。

上下文視窗越長,AI 對開頭和結尾的掌握越好——但對夾在中間的資訊處理越差。史丹佛研究人員將這個現象稱為「迷失在中間」(Lost in the Middle):放在長脈絡中段的資訊,檢索準確率會下降超過 30%。

讓主對話保持精簡,從根本上解決了這個問題。一位以前用三十分鐘就感覺品質下降的隊友,現在能連續使用超過一小時都沒問題。

  • 直接探索:主對話裡一萬五千多個 token vs. 代理摘要:六百個 token
  • 子代理在獨立的上下文中運作,只回傳關鍵資訊
  • 主對話越短,中段的盲點就越少
  • 三十分鐘品質天花板 → 同等品質下使用超過一小時

一開始就用 General 代理,是最燒錢的選擇

內建的代理類型有四種。

Explore 是唯讀的,跑在 Haiku 上——速度快、成本低。PlanGeneral 繼承主對話的模型設定:如果你用的是 Sonnet,它們就用 Sonnet;如果是 Opus,就用 Opus。Bash 則專門用來執行終端機指令。

陷阱在這裡:很多人用 General 做只需要讀取的事——程式碼探索、結構分析、模式搜尋。很少人知道,Explore 在這些任務上能跑出幾乎一樣的結果,費用卻只是一小部分。

  • Explore(基於 Haiku)比 General 省下超過 80% 的費用
  • General 只用在實作工作;其他的讓 Explore 來
  • Plan 適合大範圍閱讀,像是架構分析
  • Bash 適合測試執行和建置隔離

一個提示詞、三個平行代理,新人上手時間減半

獨立的任務可以同時進行。一個提示詞像是「分別調查驗證系統、資料庫結構和 API 路由」,就能同時啟動三個 Explore 代理。

我教了這個模式給一位新加入的團隊成員,他理解程式碼庫的時間縮短了一半。唯一的規則:絕對不要讓同時執行的代理修改同一個檔案——它們會衝突。

  • 獨立的任務 → 平行執行;有相依性的任務 → 依序執行
  • 平行執行時編輯同一個檔案 = 必定衝突
  • 在提示詞裡加上「同時」,Claude 會自動拆分任務
  • 三個同時執行的摘要,在主對話裡大約只佔六百個 token

Ctrl+B 讓你在跑測試的同時開始做下一個功能

按下 Ctrl+B,目前的代理就移到背景執行。你可以在跑完整測試套件的同時,立刻開始開發下一個功能。少了這個,你就只是在盯著進度條發呆。

背景代理不能提問,也不能使用 MCP 工具。它們只有檔案讀寫的權限——但對於跑測試和程式碼審查來說,這樣就夠了。

  • Ctrl+B 把目前的代理送到背景
  • 之後再問:「測試的結果怎樣?」
  • 背景代理:沒有 MCP 工具,只有檔案讀寫
  • 在背景跑程式碼審查,同時繼續實作

一個自訂代理檔案,可以在五個工具上重複使用

.claude/agents/reviewer.md 建立一個檔案。加上包含名稱、描述和模型的 YAML frontmatter——Claude Code 會自動偵測它,並將符合條件的任務路由到它。

這個檔案格式遵循 agentskills.io 的標準,這表示你建好的代理不需要任何修改,就能在 Cursor、Copilot、Codex 和 Gemini CLI 上運作。

執行 npx ai-agent-skills install code-review,可以立刻下載 47 個預先建好、經過驗證的代理。

  • 把 markdown 檔案放進 .claude/agents/ → 自動偵測
  • 便宜的審查設定 model: haiku;安全性稽核和錯誤處理檢查則用 opussonnet
  • 相容 Claude Code、Cursor、Copilot 和 Codex

真正的問題不是 AI 越來越笨

你的 AI 沒有失去能力。是你的主對話累積了太多上下文,讓它看不清楚全局。子代理的重點不是用更多 AI——而是保護你的 AI 思考的空間。

訂閱電子報

獲取關於我最新專案、文章以及 AI 和 Web 開發實驗的更新。