2026年4月1日 1 分鐘閱讀

2026年的 Claude Code：層次比工具更重要

我在同一週裝了三個熱門的 Claude Code 擴充功能，生產力幾乎沒有任何改變。問題從來都不是選哪些工具。

我在同一週裝了 gstack、Superpowers 和 Compound Engineering。三個口碑不錯的 Claude Code 擴充功能，各有一批忠實用家。我的預期是生產力會累加式地提升。結果換來的，是功能重疊、覆蓋缺口，以及一種揮之不去的感覺——我在收集工具，卻沒有任何評估框架。

同時跑了幾天之後，我找到了真正的問題所在。不是我不擅長選工具，而是我看不見層次。

層次在實踐中的樣子

AI 編程已經把人類的角色從寫程式碼轉移到協調代理。協調需要一套心智模型，而最終讓我豁然開朗的，是一個三層結構：決策層、流程層、知識層。我看過的每一個工具，都在某一層很強，在其他層很弱。一旦看清楚這件事，那些重疊和缺口都說得通了。

決策層

gstack 的 /plan-ceo-review 從產品角度審視工作，/plan-eng-review 從架構角度審視。兩者都在你寫下第一行程式碼之前執行。目的是把壞主意扼殺在萌芽階段。

我原本以為編程階段才是瓶頸，事實並非如此。最大的時間黑洞，是在開發那些根本不應該啟動的功能。用了 gstack 的關卡兩週之後，我發現品質的差距不在於寫出更好的程式碼，而在於寫了更少不必要的程式碼。Garry Tan 據報在這套設定下，60天內交付了60萬行程式碼。/qa 指令會開啟真實瀏覽器，像用家一樣點擊應用程式，能捕捉到單元測試完全遺漏的問題。

gstack 的不足之處：它沒有跨對話的記憶，每次審查都從零脈絡開始。

流程層

Superpowers 把工作結構化為腦力激盪、計劃、執行、審查的循環。12萬個 GitHub 星是實至名歸的。從「直接叫 AI 去做」到一套可重複的工作流程，輸出的一致性立竿見影。

我以為這就夠了，但並不。工作流程在單次對話內運作流暢，但第二天開新對話的那一刻，昨天學到的一切全部消失。子代理式的規格審查和程式碼品質審查都包含在內，運作也不錯。但系統的任何部分都沒有記錄昨天發生了什麼，以便影響今天的工作。

知識層

Compound Engineering 的 /ce:compound 指令在你完成一項任務之後執行。五個子代理並行啟動：追蹤對話脈絡、提取解決方案、檢查重複文件、生成預防策略、分類結果。所有內容都存入 docs/solutions/。

用了一週之後，我碰到一個跟之前修復過的問題相似的錯誤。在規劃階段，系統找到了之前的記錄並把解決方案呈現出來。一個本來可能耗費數小時的除錯工作，幾分鐘就解決了。/ce:review 會並行啟動至少六個獨立審查員，/ce:plan 在提出任何建議之前都會先查看 git 日誌和專案歷史。

如果說 Anthropic 的進度文件是輪班工人之間的交接記錄，Compound Engineering 的 docs/solutions/ 就是整個團隊每天都在翻閱的食譜資料夾。

找出你的空缺層

重點不是你應該裝這三個特定的工具。重點是一旦你能看見這三個層次，就能評估任何工具，或者自己搭建。

我把三個工具同時跑了一週，才意識到冗餘集中在流程層，而知識層空置了好幾個月。找出那個缺口，比任何工具裡的任何單一功能都更有價值。

審視一下你自己的工作流程。有沒有一道決策關卡，能在壞主意變成程式碼之前把它擋下來？有沒有一套每次都以同樣方式執行的定義流程？有沒有一套記得你上週學到什麼的知識系統？先找到空缺的那一層，然後填上它，哪怕那意味著自己寫一個 SKILL.md 文件，而不是安裝別人的框架。

看見層次的能力，比生態系統裡的任何具體工具都更為長久。

訂閱通訊

獲取關於我最新項目、文章同埋 AI 和 Web 開發實驗嘅更新。