目錄
2 分鐘閱讀

AI Wrapper 時代已經結束。Claude Agent Wrapper 時代正式來臨。

Anthropic 的 Tariq Shihipar 揭示了打造生產級 Agent 的核心要素 - 從 Bash 優先的工具設計到檔案系統驅動的上下文工程。

我完整分析了 Anthropic Claude Code 負責人 Tariq Shihipar 主持的 90 分鐘工作坊。

自從 Manus 出現之後,市場對 Agent 的興趣爆發性成長 - 但要怎麼打造在生產環境中真正能跑的 Agent,大家還是一頭霧水。這場工作坊就是 Anthropic 給出的答案。

不只是包一層 LLM API 的服務,當你要設計 Agent 原生應用時,到底需要改變什麼?以下是四個最關鍵的重點。

Bash 是最強大的工具

你不需要幾十個客製化工具。

  • Linux 上本來就有的軟體 - ffmpeg、jq、curl 等等 - 透過 Bash 指令組合起來就能處理大部分任務。
  • Agent 會自己讀 man page 和 --help 的輸出來學習怎麼使用工具。
  • 你不需要把每個工具的規格都塞進 prompt 裡,這代表更少的 context window 浪費。

這背後的意義非常深遠:與其為每一種功能都去打造專屬的整合介面,不如直接給 Agent 一個 shell,讓它自己組合現有軟體。所有 CLI 工具的世界都成了 Agent 的工具箱 - 而且完全不需要事先註冊。

Agent Loop 的核心是驗證

蒐集上下文 → 執行動作 → 驗證結果。

  • 判斷該不該用 Agent 的標準很簡單:你能不能驗證輸出?
  • 程式碼可以用編譯器和 linter 輕鬆驗證。研究類任務則需要另外設計驗證邏輯 - 比如要求附上來源引用。
  • 不要只依賴模型的智慧。把確定性工具 - 檔案存在檢查、語法驗證、型別檢查 - 放進迴圈裡來防止幻覺。

這是大多數團隊忽略的關鍵。他們把心力花在讓 Agent 變得更聰明,但真正該做的是讓 Agent 變得更可驗證。一個普通的模型搭配強大的驗證迴圈,表現會比一個天才模型但完全沒有驗證機制來得好。

就算不是開發工作,也靠生成程式碼來解決

即使是查天氣或分析 Email 這種簡單任務,用程式碼處理都比用文字回覆來得好。

  • 做法是:讓 Agent 即時寫腳本來串接多個 API、處理資料。
  • Claude Code 有相當大比例的使用者其實不是開發人員 - 行銷、財務、營運都有。
  • 把資料分析和重複性任務當成拋棄式程式碼來處理 - 寫一次、跑一次、用完就丟 - 正在成為標準工作流。

這重新定義了在 Agent 時代「寫程式」的意義。Agent 不需要跟你的 Email 服務商有預先建好的整合。它會自己寫一段腳本去呼叫 API、過濾資料、回傳結果 - 全部在執行時即時生成。

Context Engineering 活在檔案系統裡

除了 prompt engineering,你還需要設計 Agent 運作的環境。

  • 讓 Agent 獲得新能力,不是靠複雜的 fine-tuning。而是給它一個資料夾,裡面放好寫得清楚的 markdown 檔案和腳本。
  • Tariq 把這稱為「file system pilled」(徹底擁抱檔案系統)。
  • Agent 是有狀態的。Agent 架構的核心是一個沙箱環境 - 一個容器 - 裡面有檔案系統,Agent 可以在裡面執行 Bash 指令。

可以這樣理解:檔案系統同時扮演了 Agent 的長期記憶、參考資料庫和工作空間。專案根目錄的 CLAUDE.md 不只是文件 - 它是 Agent 的入職指南。scripts/ 目錄不只是工具程式 - 它是 Agent 的工具箱。

典範轉移

就像 Web 開發從 jQuery 演進到 React - 從命令式 DOM 操作轉向元件化架構 - Agent 開發也正在從原始的 prompt 呼叫轉向結構化框架。

問題不再是「我該問什麼?」而是「我該提供什麼權限和環境?」

真正理解這個差異的團隊 - 理解 Agent 的表現取決於系統設計而非模型本身 - 將會打造出下一個世代的軟體。

根據 Tariq Shihipar 於 Anthropic 舉辦的工作坊整理。

訂閱電子報

獲取關於我最新專案、文章以及 AI 和 Web 開發實驗的更新。