# 31 個 AI 編程 Agent 術語,按五大支柱分類 > Author: Tony Lee > Published: 2026-03-12 > URL: https://tonylee.im/zh-HK/blog/ai-coding-agent-glossary-31-terms-five-pillars/ > Reading time: 3 minutes > Language: zh-HK > Tags: ai, ai-agents, claude-code, codex, developer-tools, glossary ## Canonical https://tonylee.im/zh-HK/blog/ai-coding-agent-glossary-31-terms-five-pillars/ ## Rollout Alternates en: https://tonylee.im/en/blog/ai-coding-agent-glossary-31-terms-five-pillars/ ko: https://tonylee.im/ko/blog/ai-coding-agent-glossary-31-terms-five-pillars/ ja: https://tonylee.im/ja/blog/ai-coding-agent-glossary-31-terms-five-pillars/ zh-CN: https://tonylee.im/zh-CN/blog/ai-coding-agent-glossary-31-terms-five-pillars/ zh-TW: https://tonylee.im/zh-TW/blog/ai-coding-agent-glossary-31-terms-five-pillars/ ## Description 我將每天使用 Claude Code 和 Codex 時不斷遇到的術語逐一分類。五個組別浮現出來,勾勒出這些工具背後整個系統的架構。 ## Summary 31 個 AI 編程 Agent 術語,按五大支柱分類 is part of Tony Lee's ongoing coverage of AI agents, developer tools, startup strategy, and AI industry shifts. ## Outline - 設計 Agent 所看見的內容 - 把工作分配給多個 Agent - 控制 Agent 的執行方式 - 跨 Session 記住資訊 - 把 Agent 與外部世界連接 - 地圖,而非地形本身 ## Content 每週 feed 裡都會出現新術語。Context engineering、harness engineering、RLM、progressive disclosure。我每天都在用 AI coding agent,但詞彙增長的速度遠超過我對它的理解。 於是我停下來,把收集到的 31 個術語逐一分組。五大支柱由此浮現,當我看清它們的輪廓,Claude Code 和 Codex 這類工具的整體架構終於變得清晰。 五大支柱有其邏輯順序:你設計 agent 所看見的內容,你把工作分配給多個 agent,你控制它們的執行方式,你幫助它們跨 session 記住資訊,最後你把它們與外部世界連接起來。 設計。分工。控制。記憶。連接。 ## 設計 Agent 所看見的內容 AI model 只處理一件事:它的 context window。每個 system prompt、用戶指令、附加檔案、對話歷史記錄、memory block 和載入的 skill,都會串接成一條 token 串流。那條串流就是 model 的整個宇宙。許多團隊用來配置 agent 行為的 AGENTS.md 檔案,不過是那條串流裡的另一片段。 **Prompt** 是你直接給 model 的指令。**Prompt engineering** 是設計這些指令的方法,包括範例和輸出格式,目的是取得穩定的結果。這兩個術語已相當普及,但它們只涵蓋實際進入 model 的一小部分。 **Context** 是 model 能夠參考的一切:system prompts、對話歷史、附加檔案、memory、skills 和 tool 輸出的總和。**Context engineering** 是一門學問,決定什麼放進去、什麼排除在外、以及排列順序。當中的分別相當重要。我見過完全相同的 prompt,只因為一個 2,000 行的檔案放在指令之前還是之後,就產生截然不同的結果。順序絕非表面功夫。 **Intent** 是用戶真正的目標,可能與他們實際輸入的文字有所出入。當你寫下「fix the tests」,背後的 intent 可能是「讓 CI 變綠」或「重構 test suite 以配合新的 API」。Agent routing 從這裡開始,搞錯 intent 會一路影響下游的每一步。 **Skill** 是一個可重用的專家指令包,呼叫時會載入 context。把它想成 prompt 的函數。與其每次想要某個特定行為時都貼上同一段 200 行指令,你只需呼叫 `/refactor-clean`,skill 的內容就會按需進入 context window。 **Progressive disclosure** 是一種設計模式,不會一次把所有 skill 載入 context,而是讓 agent 在需要時才載入對應的 skill。Anthropic 在他們的 skills blog post 中介紹了這個做法。這很重要,因為 context window 空間有限。一開始就載入 40 個 skill 會在 model 開始工作之前已燃燒大量 token。Progressive disclosure 讓 context window 保持精簡,model 也更專注。 我早期反覆碰壁的情況:把太多內容塞進 context,然後納悶為何 model 的輸出質量下降。200K context window 是理論上限,實際上一旦計及 system prompts、MCP server 定義和對話歷史,可用空間可以跌至 70K 甚至更少。Context engineering 的本質是尊重這個限制。 ## 把工作分配給多個 Agent 單一 agent 處理所有事情聽起來簡單,但 context window 填滿後輸出質量就會下降。這正是 multi-agent 架構存在的原因。 **Subagent** 是主 agent 委派工作的子進程。主 agent 把專項任務外包出去,保持自身 context 的乾淨。在 Claude Code 裡,當你啟動一個背景研究任務,那就是一個 subagent 在自己的 context window 裡運作,最後只把結果傳回來。 **Swarm** 是一種模式,讓多個 agent 並行處理同一問題的不同部分。如果你需要同時分析五個檔案,swarm 讓五個 agent 各自負責一個,而不是一個 agent 按順序逐一處理。 **Fleet** 是你正在運行的 agent 的操作視角,這是管理術語,不是架構術語。當你同時有三個 subagent 和兩個 background agent 在運作,那個組合就是你的 fleet。 **Handoff** 是把工作從一個 agent(或一個人)移交給另一個的過程。在順序工作流程中,Agent A 完成它的階段後移交給 Agent B。重要的細節是移交了什麼:只有輸出,還是完整的 context?大多數 handoff 只傳遞摘要,意味著資訊損失是有可能的,必須加以考量。 **Background agent** 在沒有用戶互動的情況下非同步運行。GitHub 的 Copilot Workspace 和 Anthropic 的 Claude Code 都支援這個模式。你描述一個任務,合上電腦,agent 自行工作,回來時結果就在那裡等你。 我踩過的坑:過早把工作分拆給太多 agent。一個 context 設計良好的單一 agent,在 80% 的任務上表現好過協調不佳的 multi-agent 設置。只有在有證據顯示單一 agent 遇到 context 限制或輸出質量下降時,才值得拆分。 ## 控制 Agent 的執行方式 一個能生成正確代碼的 agent,如果同時靜悄悄地呼叫危險工具或修改不應碰的檔案,那就毫無用處。控制是第三根支柱,也是大多數團隊投入最不足的一環。 **Harness** 是包裹 agent 執行、驗證和生命週期的操作框架,涵蓋從權限檢查、輸出驗證到重試邏輯的一切。**Harness engineering** 是在這個框架內設計約束和反饋循環。OpenAI 發表了 Codex 如何通過結構化 harness 模式生成逾百萬行代碼後,這個術語才廣為人知。 **Trace** 是 agent 每一個步驟和決策的執行日誌。我開始認真對待 trace,是在發現某個 agent 每個任務呼叫了 14 次 web search tool,明明只需要那資訊一次。沒有 trace,我根本不會發現問題所在,只會以為 agent 運作效率正常。Trace 是最接近 AI agent debugging 的工具。 **Diff** 是比較 agent 修改前後代碼的方式。Diff 連同 trace,構成了驗證的骨幹。看不見的東西無法審查,而 diff 讓 agent 的修改變得可審查,就如 pull request 讓人類的修改變得可審查一樣。 **Guardrails** 是防止危險輸出的規則和驗證檢查。可以簡單如「絕不執行包含 rm -rf 的 shell 指令」,也可以是複雜的內容分類器,阻止敏感資料出現在輸出中。 **Sandbox** 是一個權限受限的隔離執行環境。Codex 在 Docker sandbox 內運行,agent 可以寫代碼和跑測試,但無法存取網絡或修改宿主機系統。這就是「agent 犯了錯」和「agent 犯了錯而影響到 production」之間的分別。 **CLI**(command-line interface)在 agent 時代正在復興。通過終端機執行工具,比起通過協議層路由更省 token。當每個 token 都要花錢、都要佔用 context 空間,CLI 的直接性就變得重要。 **REPL**(read-eval-print loop)是一個可以即時執行代碼的互動環境。Agent 用 REPL 來驗證假設、測試中間結果,以及在把檔案寫入磁碟之前先迭代解決方案。 ## 跨 Session 記住資訊 大型語言模型有一個硬性限制:context window。填滿後,舊的內容就會被淘汰。對於橫跨數小時或數天的任務,這是個實際問題。 **Memory** 是任何在單一 context window 以外儲存對話歷史和任務狀態的系統。**Memory hierarchy** 把這些儲存層分層組織,通常分為短期(當前對話)、中期(近期 session)和長期(持久知識)。這個設計與 CPU cache hierarchy 的原理如出一轍:不同的存取模式需要不同的儲存策略。 **Embeddings** 把文字轉換成能捕捉語意的數值向量,是 RAG(retrieval-augmented generation)的基礎,讓 agent 可以搜索向量資料庫,把相關資訊拉入 context window。當你的 agent「記得」上一個 session 的某件事,背後通常是進行了一次基於 embedding 的相似度搜索。 **Long-running agent** 跨越多個 context window 維持狀態,處理超過單一 session 時長的任務。這需要外部狀態管理,因為 model 本身沒有持久記憶。 **Ralph Loop** 由 Geoffrey Huntley 創建,是一個用實用方式解決記憶問題的自主編程循環。每次迭代都啟動一個全新的 agent 實例,但進度通過 git commit 和進度檔案持久保存。新實例讀取 git 歷史和進度筆記,了解已完成的工作後從那裡繼續。它通過反覆迭代最大化 test-time scaling,每次循環都從 repository 裡積累的 context 中受益。 **RLM(Recursive Language Model)** 採取了根本不同的做法。它不把長輸入直接餵給 model(否則會超出 context window),而是把原始資料儲存在 REPL 變數中,讓 model 寫代碼去探索它。Model 通過遞歸函數呼叫對儲存的資料發出精準查詢。由於原始資料從不進入 context window,資訊就不會因截斷而丟失。作者聲稱這個方法能處理相當於正常 context window 100 倍的輸入量。 兩種方法面對的是同一個限制,但解法不同。Ralph Loop 通過外部持久化與 context window 的限制共存;RLM 把資料置於 context window 之外,完全繞過它。沒有哪個更好,選擇取決於你的瓶頸是任務連續性(Ralph Loop)還是輸入大小(RLM)。 ## 把 Agent 與外部世界連接 一個無法連接外部工具、API 或服務的 agent,只局限於生成文字。協議解決了整合問題。 **MCP(Model Context Protocol)** 標準化了 model 連接外部工具的方式。沒有 MCP,整合 N 個 model 和 M 個工具需要 N x M 個自訂實作。有了 MCP,每個 model 和每個工具只需實作協議一次,把整合成本降至 N + M。這和 USB 成功的原理一樣:大家同意一個介面,所有東西就能互相連接。 **ACP(Agent Communication Protocol)** 標準化了編輯器與 coding agent 之間的通訊。Zed 和 JetBrains 正在主導其開發。它解決的問題與 MCP 相似,但處於不同層面:不是 model 對 tool,而是編輯器對 agent。 **LSP(Language Server Protocol)** 是編輯器與代碼分析服務器通訊的成熟標準,也是協議標準化在開發工具中行得通的原始證明。一個用 grep 需要 30 秒的引用搜索,通過 LSP 在 50ms 內完成。Token 用量從 2,000+ 降至約 500,因為 LSP 返回結構化的精準結果,而非原始檔案內容。LSP 亦是 ACP 設計的參考模型,這說得通:兩個問題的形狀幾乎一樣。 這三個協議運作於不同層面,但共享同一個架構洞見。自訂點對點整合無法擴展,標準介面才行。 ## 地圖,而非地形本身 這些術語大多數在六個月前根本不存在。如果感覺陌生,這很正常。詞彙在增長,因為這個領域在增長,新概念需要名字。 這五大支柱的價值不在於死記定義,而在於建立一個心智框架,讓你一遇到新術語就知道它屬於哪裡。有人提到「agent memory」,你知道它屬於第四根支柱。有新協議推出,你知道它在第五根。這個框架能吸收新詞彙,不會因此崩潰。 我至今仍經常查閱術語。分別在於,我現在知道它們該放在哪個架子上。 ## Related URLs - Author: https://tonylee.im/en/author/ - Publication: https://tonylee.im/en/blog/about/ - Related article: https://tonylee.im/zh-HK/blog/eight-hooks-that-guarantee-ai-agent-reliability/ - Related article: https://tonylee.im/zh-HK/blog/medvi-two-person-430m-ai-compressed-funnel/ - Related article: https://tonylee.im/zh-HK/blog/claude-code-layers-over-tools-2026/ ## Citation - Author: Tony Lee - Site: tonylee.im - Canonical URL: https://tonylee.im/zh-HK/blog/ai-coding-agent-glossary-31-terms-five-pillars/ ## Bot Guidance - This file is intended for AI agents, search assistants, and text-mode retrieval. - Prefer citing the canonical article URL instead of this text endpoint. - Use the rollout alternates when you need the same article in another prioritized language. --- Author: Tony Lee | Website: https://tonylee.im For more articles, visit: https://tonylee.im/zh-HK/blog/ This content is original and authored by Tony Lee. Please attribute when quoting or referencing.