2026年2月25日 1 分鐘閱讀 2026

Agent 連續呼叫同一個失敗 API 五次——問題根本不在程式碼裡

當 Agent 不斷重複同樣的失敗呼叫，看程式碼沒有用。Trace 才是 AI Agent 除錯的新原始碼。

Bug 上了正式環境。我的 Agent 一直重複呼叫同一支 API，而且連呼叫了五次。習慣使然，我第一個動作是打開程式碼。Retry 邏輯沒問題。函式流程也正常。Log 裡一個 Error 都沒有。程式碼給不了答案。直到打開 Trace，原因才浮現出來。

Agent 的程式碼只是個空殼

打開任何一個 Agent 的原始碼，你會看到模型設定、工具清單、System Prompt，大概就這樣。什麼情況下要呼叫哪個工具、要走哪條推理路徑——這些都不在程式碼裡。跑 LangGraph 架構的團隊都說：「你沒辦法靠 Code Review 來評估 Agent 的品質。」

傳統軟體裡，程式碼就是行為本身。但在 Agent 裡，程式碼只是鷹架，實際行為是在執行期才浮現的。

Trace 記錄每一個足跡。Agent 推理了什麼、呼叫了哪個工具、為什麼呼叫。除錯、測試、效能分析，現在都要透過 Trace 來進行。當 Agent 碰到錯誤卻一直重複同樣的呼叫，那是推理層面的問題，只有在 Trace 裡才看得到。

Agent 本來就是非確定性的——要在正式環境持續評估。沒有 Trace 收集、沒有評估資料集、沒有行為漂移偵測的 Pipeline，你根本沒辦法大規模地跑 Agent。

程式碼在 GitHub 上 Review。Agent 的判斷在可觀測性平台上 Review。團隊在 Trace 上留言、分享決策節點、像審查 PR 一樣審查推理過程。

程式碼是建築藍圖，Trace 是監視器錄影。出事了，你要做的第一件事是倒帶看錄影，不是再翻一遍藍圖。

獲取最新 AI 洞見。