AI Wrapper 時代已經結束。Claude Agent Wrapper 時代正式來臨。
Anthropic 的 Tariq Shihipar 揭示了打造生產級 Agent 的核心要素 - 從 Bash 優先的工具設計到檔案系統驅動的上下文工程。
我完整分析了 Anthropic Claude Code 負責人 Tariq Shihipar 主持的 90 分鐘工作坊。
自從 Manus 出現之後,市場對 Agent 的興趣爆發性成長 - 但要怎麼打造在生產環境中真正能跑的 Agent,大家還是一頭霧水。這場工作坊就是 Anthropic 給出的答案。
不只是包一層 LLM API 的服務,當你要設計 Agent 原生應用時,到底需要改變什麼?以下是四個最關鍵的重點。
Bash 是最強大的工具
你不需要幾十個客製化工具。
- Linux 上本來就有的軟體 - ffmpeg、jq、curl 等等 - 透過 Bash 指令組合起來就能處理大部分任務。
- Agent 會自己讀 man page 和
--help的輸出來學習怎麼使用工具。 - 你不需要把每個工具的規格都塞進 prompt 裡,這代表更少的 context window 浪費。
這背後的意義非常深遠:與其為每一種功能都去打造專屬的整合介面,不如直接給 Agent 一個 shell,讓它自己組合現有軟體。所有 CLI 工具的世界都成了 Agent 的工具箱 - 而且完全不需要事先註冊。
Agent Loop 的核心是驗證
蒐集上下文 → 執行動作 → 驗證結果。
- 判斷該不該用 Agent 的標準很簡單:你能不能驗證輸出?
- 程式碼可以用編譯器和 linter 輕鬆驗證。研究類任務則需要另外設計驗證邏輯 - 比如要求附上來源引用。
- 不要只依賴模型的智慧。把確定性工具 - 檔案存在檢查、語法驗證、型別檢查 - 放進迴圈裡來防止幻覺。
這是大多數團隊忽略的關鍵。他們把心力花在讓 Agent 變得更聰明,但真正該做的是讓 Agent 變得更可驗證。一個普通的模型搭配強大的驗證迴圈,表現會比一個天才模型但完全沒有驗證機制來得好。
就算不是開發工作,也靠生成程式碼來解決
即使是查天氣或分析 Email 這種簡單任務,用程式碼處理都比用文字回覆來得好。
- 做法是:讓 Agent 即時寫腳本來串接多個 API、處理資料。
- Claude Code 有相當大比例的使用者其實不是開發人員 - 行銷、財務、營運都有。
- 把資料分析和重複性任務當成拋棄式程式碼來處理 - 寫一次、跑一次、用完就丟 - 正在成為標準工作流。
這重新定義了在 Agent 時代「寫程式」的意義。Agent 不需要跟你的 Email 服務商有預先建好的整合。它會自己寫一段腳本去呼叫 API、過濾資料、回傳結果 - 全部在執行時即時生成。
Context Engineering 活在檔案系統裡
除了 prompt engineering,你還需要設計 Agent 運作的環境。
- 讓 Agent 獲得新能力,不是靠複雜的 fine-tuning。而是給它一個資料夾,裡面放好寫得清楚的 markdown 檔案和腳本。
- Tariq 把這稱為「file system pilled」(徹底擁抱檔案系統)。
- Agent 是有狀態的。Agent 架構的核心是一個沙箱環境 - 一個容器 - 裡面有檔案系統,Agent 可以在裡面執行 Bash 指令。
可以這樣理解:檔案系統同時扮演了 Agent 的長期記憶、參考資料庫和工作空間。專案根目錄的 CLAUDE.md 不只是文件 - 它是 Agent 的入職指南。scripts/ 目錄不只是工具程式 - 它是 Agent 的工具箱。
典範轉移
就像 Web 開發從 jQuery 演進到 React - 從命令式 DOM 操作轉向元件化架構 - Agent 開發也正在從原始的 prompt 呼叫轉向結構化框架。
問題不再是「我該問什麼?」而是「我該提供什麼權限和環境?」
真正理解這個差異的團隊 - 理解 Agent 的表現取決於系統設計而非模型本身 - 將會打造出下一個世代的軟體。
根據 Tariq Shihipar 於 Anthropic 舉辦的工作坊整理。
訂閱電子報
獲取關於我最新專案、文章以及 AI 和 Web 開發實驗的更新。