AI Wrapper 時代已經結束。Claude Agent Wrapper 時代正式開啟。
Anthropic 的 Tariq Shihipar 揭示了構建生產級 Agent 的核心要素 - 由 Bash 優先的工具設計到檔案系統驅動的上下文工程。
我分析了由 Anthropic 的 Claude Code 負責人 Tariq Shihipar 主持的 90 分鐘工作坊。
自從 Manus 面世以來,業界對 Agent 的興趣急速升溫 - 但到底如何構建能夠在生產環境中真正運作的 Agent,一直都是含糊不清。這場工作坊正是 Anthropic 對這個問題的回應。
除了單純包裝 LLM API 的服務之外,在設計 Agent 原生應用時還需要作出甚麼改變?以下是四個關鍵重點。
Bash 是最強大的工具
你根本不需要幾十個自訂工具。
- Linux 上已有的軟件 - ffmpeg、jq、curl 等等 - 透過 Bash 指令組合起來,已經可以處理大部分任務。
- Agent 能夠自行閱讀 man pages 和
--help輸出,從而學懂如何使用工具。 - 你毋須將每一個工具的規格都塞入 prompt 裏面,意味着大大減少 context window 的浪費。
這背後的意義相當深遠:與其為每一項功能都構建專用的整合方案,你只需要給 Agent 一個 shell,讓它自行組合現有的軟件。整個 CLI 工具生態就是 Agent 的工具箱 - 而且完全毋須預先註冊。
Agent 迴圈的核心是驗證
收集上下文 → 執行操作 → 驗證成果。
- 判斷是否適合使用 Agent 的標準非常簡單:你能否驗證輸出結果?
- 程式碼透過編譯器和 linter 便能輕易驗證。至於研究類任務,則需要另行設計驗證邏輯 - 例如要求提供來源引用。
- 不要單靠模型的智能。將確定性工具 - 檔案存在性檢查、語法驗證、型別檢查 - 放入迴圈之中,以防止幻覺問題。
這正是大多數團隊忽略的關鍵。他們專注於令 Agent 更加聰明,但其實應該專注於令 Agent 更加可驗證。一個配備強力驗證迴圈的普通模型,表現會優於一個完全沒有驗證機制的頂尖模型。
即使非開發工作,都透過代碼生成來解決
即使是查詢天氣或分析電郵這類簡單任務,用代碼來處理都比用文字回應更有效。
- 方法是:讓 Agent 即時編寫腳本,連接多個 API 並處理數據。
- Claude Code 有相當大比例的用戶其實並非開發人員 - 而是市場營銷、財務、營運等崗位。
- 將數據分析和重複性任務視為一次性代碼 - 寫完即用、用完即棄 - 正逐漸成為標準工作流程。
這重新定義了在 Agent 時代「寫 code」的意義。Agent 不需要預先構建好與你的電郵供應商的整合。它會自行編寫一段腳本去呼叫 API、過濾數據、返回結果 - 全部在運行時即時生成。
上下文工程存在於檔案系統之中
在 prompt engineering 之上,你還需要設計 Agent 所處的工作環境。
- 賦予 Agent 新能力並不需要複雜的微調。只需要給它一個資料夾,裏面放好寫得清晰的 markdown 檔案和腳本就足夠。
- Tariq 形容這叫做「file system pilled」。
- Agent 是有狀態的。Agent 架構的核心是一個沙盒環境 - 一個 container - Agent 在其中可以存取檔案系統並執行 Bash 指令。
可以這樣理解:檔案系統同時充當 Agent 的長期記憶、參考資料庫和工作空間。放在項目根目錄的 CLAUDE.md 檔案不僅僅是文檔 - 它是 Agent 的入職指南。scripts/ 目錄不僅僅是工具集 - 它是 Agent 的裝備庫。
範式轉移
正如 Web 開發從 jQuery 進化到 React - 從命令式 DOM 操作轉向組件化架構 - Agent 開發也正在從原始的 prompt 呼叫轉向結構化框架。
問題不再是「我應該問甚麼?」而是「我應該提供甚麼權限和環境?」
那些理解這個區別的團隊 - 明白 Agent 的表現取決於周圍系統多於模型本身 - 將會構建出下一代軟件。
基於 Tariq Shihipar 在 Anthropic 的工作坊內容。
訂閱通訊
獲取關於我最新項目、文章同埋 AI 和 Web 開發實驗嘅更新。