# Agent 連續呼叫同一個失敗 API 五次——問題根本不在程式碼裡

> Author: Tony Lee
> Published: 2026-02-25
> URL: https://tonylee.im/zh-TW/blog/agent-debugging-traces-not-code/
> Reading time: 1 minutes
> Language: zh-TW
> Tags: ai, ai-agents, observability, tracing, langsmith, debugging

## Canonical

https://tonylee.im/zh-TW/blog/agent-debugging-traces-not-code/

## Rollout Alternates

en: https://tonylee.im/en/blog/agent-debugging-traces-not-code/
ko: https://tonylee.im/ko/blog/agent-debugging-traces-not-code/
ja: https://tonylee.im/ja/blog/agent-debugging-traces-not-code/
zh-CN: https://tonylee.im/zh-CN/blog/agent-debugging-traces-not-code/
zh-TW: https://tonylee.im/zh-TW/blog/agent-debugging-traces-not-code/

## Description

當 Agent 不斷重複同樣的失敗呼叫，看程式碼沒有用。Trace 才是 AI Agent 除錯的新原始碼。

## Summary

Agent 連續呼叫同一個失敗 API 五次——問題根本不在程式碼裡 is part of Tony Lee's ongoing coverage of AI agents, developer tools, startup strategy, and AI industry shifts.

## Outline

- Agent 的程式碼只是個空殼
- Trace 才是新的原始碼
- 測試的思維必須根本性地改變
- 協作和產品分析也都發生在 Trace 上
- 結語

## Content

Bug 上了正式環境。我的 Agent 一直重複呼叫同一支 API，而且連呼叫了五次。習慣使然，我第一個動作是打開程式碼。Retry 邏輯沒問題。函式流程也正常。Log 裡一個 Error 都沒有。程式碼給不了答案。直到打開 Trace，原因才浮現出來。

## Agent 的程式碼只是個空殼

打開任何一個 Agent 的原始碼，你會看到模型設定、工具清單、System Prompt，大概就這樣。什麼情況下要呼叫哪個工具、要走哪條推理路徑——這些都不在程式碼裡。跑 LangGraph 架構的團隊都說：「你沒辦法靠 Code Review 來評估 Agent 的品質。」

- 同樣的程式碼、同樣的輸入，每次的工具呼叫模式都不一樣
- 跟 `handleSubmit()` 不同，分支邏輯根本不存在於程式碼中
- GPT-5.2 同一個問題問十次：工具呼叫順序的一致性大概只有四成
- 明明出錯了卻找不到程式碼的 Bug，根本無從重現

傳統軟體裡，程式碼就是行為本身。但在 Agent 裡，程式碼只是鷹架，實際行為是在執行期才浮現的。

## Trace 才是新的原始碼

Trace 記錄每一個足跡。Agent 推理了什麼、呼叫了哪個工具、為什麼呼叫。除錯、測試、效能分析，現在都要透過 Trace 來進行。當 Agent 碰到錯誤卻一直重複同樣的呼叫，那是推理層面的問題，只有在 Trace 裡才看得到。

- 比對兩份 Trace，Prompt 改動帶來的影響馬上一清二楚
- 在 LangSmith 載入 Trace 就像打中斷點一樣
- 一份 Trace 就能精確定位推理在哪個環節出了軌

## 測試的思維必須根本性地改變

Agent 本來就是非確定性的——要在正式環境持續評估。沒有 Trace 收集、沒有評估資料集、沒有行為漂移偵測的 Pipeline，你根本沒辦法大規模地跑 Agent。

- 每週自動從正式環境的 Trace 中取樣，跑評估 Pipeline
- 只靠上線前的測試，無法保證非確定性系統的品質
- 沒有 Trace 的監控，等於只有在看伺服器有沒有活著
- Agent 可以「看起來運作正常」，但其實在做錯誤的事——只有 Trace 抓得到這種問題

## 協作和產品分析也都發生在 Trace 上

程式碼在 GitHub 上 Review。Agent 的判斷在可觀測性平台上 Review。團隊在 Trace 上留言、分享決策節點、像審查 PR 一樣審查推理過程。

- 產品分析工具和除錯工具，最終都會匯聚到 Trace 上
- 分析工具呼叫模式，可以反推使用者真正的需求

## 結語

程式碼是建築藍圖，Trace 是監視器錄影。出事了，你要做的第一件事是倒帶看錄影，不是再翻一遍藍圖。

## Related URLs

- Author: https://tonylee.im/zh-TW/author/
- Publication: https://tonylee.im/zh-TW/blog/about/
- Related article: https://tonylee.im/zh-TW/blog/eight-hooks-that-guarantee-ai-agent-reliability/
- Related article: https://tonylee.im/zh-TW/blog/medvi-two-person-430m-ai-compressed-funnel/
- Related article: https://tonylee.im/zh-TW/blog/claude-code-layers-over-tools-2026/

## Citation

- Author: Tony Lee
- Site: tonylee.im
- Canonical URL: https://tonylee.im/zh-TW/blog/agent-debugging-traces-not-code/

## Bot Guidance

- This file is intended for AI agents, search assistants, and text-mode retrieval.
- Prefer citing the canonical article URL instead of this text endpoint.
- Use the rollout alternates when you need the same article in another prioritized language.

---

Author: Tony Lee | Website: https://tonylee.im
For more articles, visit: https://tonylee.im/zh-TW/blog/
This content is original and authored by Tony Lee. Please attribute when quoting or referencing.