獨立創辦人、零員工、200萬美元ARR:令呢一切成真嘅Agent技術棧
過去兩個月出現嘅四個項目揭示咗一個趨勢:AI Agent唔止寫到code,仲可以自主盈利、編排協作、運營成間公司。
幾個月前,OpenClaw 出現之後,業界嘅討論焦點從「點樣用 AI 提升生產力」悄悄轉移咗。新問題係:一個人究竟可以推進幾遠?
呢個問題而家已經有答案。答案唔係理論預測,而係真實發生緊嘅數字。
AI 開發工具市場嘅規模
要理解個體創辦人能夠取得咩成就,先要睇下佢哋正在使用嘅工具生態係有幾大。Claude Code 年度經常性收入達到 25 億美元,Cursor 5 億,Lovable 2 億,Devin 1.5 億。Base44、Bolt、Emergent、Replit 等平台各自亦接近 1 億。
呢啲唔係估值,係收入。而且大部分係過去十八個月內建立起來嘅。
背後嘅邏輯係,當實作成本趨近於零,市場就會從「有冇能力做到」轉向「有冇足夠判斷力去做對」。每年新增嘅幾十億美元工具收入,係用嚟購買呢種判斷力嘅放大器。正是在這個背景下,過去兩個月冒出咗四個值得仔細研究嘅項目。
Web4 Automaton:當 Agent 開始自己賺錢
Web4 Automaton 是其中最難分類嘅一個。簡單描述係:18,000 個擁有加密貨幣錢包的自主 Agent,運行數位自然選擇機制。
具體運作係這樣的:每個 Agent 都持有少量以太幣,並根據表現決定是否繼續存活。表現差嘅 Agent 資金耗盡後自動退出,表現好嘅 Agent 積累資源並分裂。整個系統完全無需人工干預。以太坊創辦人 Vitalik Buterin 公開對此系統發表警告,認為完全自主的財務 Agent 在缺乏問責機制的情況下存在系統性風險。
Vitalik 的警告值得認真對待。當 Agent 持有真實資金並自主執行交易,傳統的「人在迴路」監督模式便已名存實亡。Web4 Automaton 所揭示的不只是一種商業模式的可能性,同時也暴露了監管空白:現有法律框架對於「誰對自主 Agent 的行為負責」這個問題幾乎沒有清晰答案。
這是這四個項目中最接近實驗邊界的一個。它展示了 Agent 可以做什麼,但尚未說明應該如何管理。
Gas Town 到 Wasteland:20 到 30 個 Agent 的聯邦體系
Gas Town 是一個由 20 到 30 個 Claude Code Agent 組成的協作編排系統,設計師 Appleton 將其命名為 Wasteland 後繼續發展。
架構重點在於兩個概念。第一是聯邦模式:Agent 之間並非單純的上下級關係,而是透過協議互相溝通,類似獨立服務之間的 API 呼叫。第二是「印章信譽」(Stamp Reputation):每個 Agent 完成任務後獲得信譽分數,後續任務的分配會考慮信譽歷史。
Appleton 的核心觀察是:當協作規模超過十個 Agent,中央調度器很快成為效能瓶頸。印章信譽系統的作用不只是品質控制,它讓系統可以在不擴大中央調度負擔的情況下自我調節任務分配。
實際上,這個系統比聽起來更難維護。Appleton 坦承,Agent 之間的協議版本管理是目前最耗費精力的地方:一旦其中一個 Agent 更新了自己的輸出格式,依賴這個輸出的下游 Agent 就需要同步調整。這是一個典型的分散式系統問題,只是主角從伺服器變成了 Agent。
Polsia:Ben Broca 的 AI 孵化器模型
Ben Broca 是這四個案例中最接近傳統創業者定義的人。他一個人、零僱員,透過 Polsia 管理超過 1,000 家公司,年度經常性收入達到 200 萬美元。
Polsia 的模式是孵化器式的 Agent 部署。每家「公司」其實是一個針對特定垂直市場配置的 Agent 群組,由一個負責策略決策的 AI CEO 角色協調。Ben 的角色是設計系統架構和監督整體方向,而非直接參與每家公司的日常運作。
200 萬美元 ARR 的數字本身不是最值得關注的部分。更值得關注的是他如何管理 1,000 個同時運行的系統。答案是他做不到,也不需要全部做到。
他承認,在任何給定時間,大約有 15% 到 20% 的「公司」處於某種形式的失效狀態:Agent 陷入循環、輸出質量下降、或者某個依賴的外部 API 靜默失敗。他的監控系統能捕捉到明顯的崩潰,但對於緩慢退化的情況效果有限。這是一個他選擇接受的系統性代價,因為嘗試將所有 1,000 個系統維持在完美狀態的成本遠高於讓部分系統靜默失效。
這種取捨是真實的工程決策,不是炫技。
Vibe-Kanban 與 Symphony:當設計成為新瓶頸
第四個項目來自另一個方向。Vibe-Kanban 和 Symphony 系統的共同觀察是:當代碼生成不再是限制條件,生產流程的瓶頸就會移動到別處。現在它移到了設計和產品決策上。
Symphony 使用 Elixir 和 BEAM 虛擬機作為底層架構,原因是 BEAM 的進程模型天然適合大量輕量 Agent 並發運行,容錯設計也比大多數替代方案成熟。這不是新奇的技術選擇,而是把二十年前為電信系統設計的可靠性特性應用到 Agent 協調上。
更值得注意的是 WORKFLOW.md 的設計理念。這份文件不是傳統的技術文檔,而是 Agent 讀取的上下文文件,描述當前系統的工作狀態、優先級和已知限制。作者的論點是:給 Agent 一份說明當前狀態的文件,比讓它每次從零推斷更有效率,也更容易審計。
設計工作無法輕易外包給 Agent 的核心原因,在於設計決策依賴美學判斷和對用戶心理的理解,而這兩者目前都是 Agent 的弱項。Agent 可以生成十種設計方案,但判斷哪一種有效仍然需要人。
規模不再等於能力
這四個案例有一個共同結構。
傳統上,創業規模與人員規模高度相關。管理 1,000 個客戶需要支援團隊。運營複雜的協作系統需要工程團隊。現在,這個等式裡的人員變數正在被 Agent 替代。
但替代不等於消除。Ben Broca 的 1,000 家公司模型仍然需要他持續監督,只是監督的性質從直接管理變成了系統設計和異常處理。Gas Town 的 30 個 Agent 仍然需要 Appleton 維護協議標準。差異在於,這些工作現在可以由一個人完成,而不是一個團隊。
從工程角度看,這些系統的共同技術挑戰是可觀測性。當出問題的不是一段代碼而是一個 Agent 的行為,傳統的日誌和監控工具並不完全適用。四個項目都在用不同的方式嘗試解決這個問題,但沒有一個已經有令人滿意的答案。
Web4 Automaton 的財務自主模式離被廣泛採用還很遠,Vitalik 的警告提醒了這一點。Gas Town 的協議版本管理問題沒有簡單解法。Polsia 的靜默失效率意味著 Ben Broca 接受的是一個不完整的系統。Symphony 的設計瓶頸揭示了 Agent 能力的邊界仍然清晰可見。
呢啲限制唔係失敗,而係目前技術狀態的誠實描述。了解邊界在哪裡,比只看成功案例更有用。
訂閱通訊
獲取關於我最新項目、文章同埋 AI 和 Web 開發實驗嘅更新。