2026年的Claude Code:層次比工具更重要
同一週安裝了三個熱門的Claude Code擴充套件,生產力幾乎沒有變化。問題從來不是挑了哪些工具。
我在同一週裝了gstack、Superpowers和Compound Engineering。三個評價都不錯的Claude Code擴充套件,各自都有擁護者。我預期的是生產力的複利效果,實際得到的卻是功能重疊、覆蓋缺口,以及一種揮之不去的感覺:我在收集工具,卻沒有一套評估框架。
同時跑了幾天之後,我找到了真正的問題所在。不是我不擅長選工具,而是我從來沒看見過層次。
層次在實務中長什麼樣子
AI程式開發已經把人的角色從寫程式轉移到協調代理。協調需要心智模型,而最後終於讓我有所頓悟的那個,分成三層:決策、流程、知識。我看過的每一個工具,在其中一層都很強,在其他層都很弱。一旦看清楚這件事,那些重疊和缺口同時都說得通了。
決策層
gstack的/plan-ceo-review從產品視角審視工作,/plan-eng-review從架構視角審視。兩者都在你寫第一行程式碼之前執行,目的是趁早砍掉壞主意。
我原本以為撰碼階段才是瓶頸,事實不然。最大的時間黑洞是做了那些根本不該開始的功能。連續兩週使用gstack的審查關卡之後,我注意到品質的提升,來自「寫了更少不必要的程式碼」,而不是「寫了更好的程式碼」。Garry Tan據報導在60天內透過這套配置交付了60萬行程式碼。/qa指令會開啟真實的瀏覽器,像使用者一樣點擊整個應用程式,能抓到單元測試完全遺漏的問題。
gstack的不足之處:跨工作階段沒有記憶。每一次審查都從零開始。
流程層
Superpowers把工作結構化成腦力激盪、計畫、執行、審查的循環。GitHub上12萬顆星是實至名歸的。從「直接叫AI去做」轉換成可重複的工作流程,輸出的一致性立刻有了明顯差異。
我以為這樣就夠了,但不夠。工作流在單一工作階段內運行得很順暢,但一旦隔天開了新工作階段,昨天學到的一切就消失了。內建的子代理規格審查員和程式碼品質審查員功能都很好,但整個系統沒有任何部分記錄昨天發生了什麼,以便用來指引今天要做的事。
知識層
Compound Engineering的/ce:compound指令在完成一項任務之後執行。五個子代理同時並行啟動:追蹤對話情境、萃取解法、檢查重複文件、產生預防策略、分類結果。所有內容都寫入docs/solutions/。
開始使用一週之後,我碰到一個類似之前已修過的錯誤。在計畫階段,系統找到了之前的紀錄並浮現了解法。本來可能要花幾小時的除錯工作,結果幾分鐘就解決了。/ce:review至少並行執行六個獨立審查員。/ce:plan在提出任何建議之前,會先查閱git紀錄和專案歷史。
如果說Anthropic的進度追蹤檔案是交班人員之間的交接筆記,那Compound Engineering的docs/solutions/就是整個團隊每天翻閱的食譜冊。
找出你的空層
重點不是你應該安裝這三個特定工具,而是一旦你能看見這三個層次,就能評估任何工具,或者自己建造。
我把三個工具同時跑了一週,才意識到冗餘集中在流程層,而知識層幾個月來一直是空的。找出那個缺口,比這些工具裡的任何單一功能都更有價值。
檢視你自己的工作流程。有沒有一道決策關卡,能在壞主意變成程式碼之前就擋下它?有沒有一套每次都以同樣方式執行的明確流程?有沒有一個知識系統,記得你上週學到了什麼?先找出空層,然後填滿它,就算這代表你要自己寫一份SKILL.md檔案,而不是安裝別人的框架。
看見層次的能力,會比生態圈裡的任何特定工具活得更長久。
訂閱電子報
獲取關於我最新專案、文章以及 AI 和 Web 開發實驗的更新。