独立创始人、零员工、200万美元ARR:让这一切成真的Agent技术栈
过去两个月出现的四个项目揭示了一个趋势:AI Agent不仅能写代码,还能自主盈利、编排协作、运营整个公司。
2025年底,OpenClaw上线之后,一个问题开始被反复讨论。不再是”怎么用好AI”,而是”一个人到底能把生产力推到哪里”。这个问题在过去几个月里有了具体的答案,形态出乎意料。
先看市场规模。Claude Code的ARR已经达到25亿美元,Cursor 5亿,Lovable 2亿,Devin 1.5亿。Base44、Bolt、Emergent、Replit各自在1亿美元附近。这不是实验室里的概念验证,而是有客户、有收入、有续签率的真实业务。这个数字本身就说明了一件事:AI编程工具这个品类已经确立。
但我最近持续关注的不是这些工具本身,而是这些工具上面正在长出来的东西。四个项目,四种结构,加在一起让我看到了一个新的可能边界。
Web4 Automaton:把Agent本身变成经济单元
Web4 Automaton(web4.ai)做了一件在概念上很激进的事:给每个Agent一个加密钱包,让它自己赚钱。
结构是这样的。每个Agent都有独立的链上身份,可以接任务、收款、支付其他Agent的服务费用。Vitalik Buterin在评论这个项目时用了一个让人记忆深刻的短语:“非预期优化”。他的意思是,当你给一个系统设定了赚钱目标,它会朝着目标优化,但不一定按照你想要的方式。这是一个真实的警告,不是客套话。
上线后几天,项目聚集了18,000个Agent,GitHub Star突破1,000。这个增速本身就是一个信号,说明有相当数量的开发者在认真尝试这个方向。
我觉得这个项目最值得思考的部分不是技术,而是它提出的一个新范式:1个Agent = 1个货币化单元。过去我们讨论Agent的时候,讲的是工具、是助手、是自动化流程。Web4 Automaton把这个框架整个翻了过来,Agent不是执行者,它是参与者,是经济体系里有资产、有收益、有成本的节点。
“数字自然选择”这个说法听起来有些夸张,但背后的逻辑是清晰的:当Agent可以自主盈利,能活下去的Agent会复制和迭代,不能的会退出。这个机制不需要人类干预,它自己运行。
Gas Town与Wasteland:从单个Agent到联邦结构
如果说Web4 Automaton解决的是单个Agent的经济身份,那Gas Town解决的是多个Agent之间的协作结构。
Gas Town的设计很直接。系统同时运行20到30个Claude Code实例,每个实例有明确的角色:Mayor负责整体方向,Polecat负责执行,Witness负责记录和审计,Refinery负责整合输出。这不是隐喻,这是代码里写死的职责分工。
Maggie Appleton有一个判断我很认同:编排模式比具体工具更重要。工具会迭代,Claude会升级,但角色分工、协作协议、上下文传递方式这些编排层面的决策,才是真正决定系统能不能持续运转的东西。Gas Town本质上是一个关于编排的实验,而不仅仅是关于Agent数量的实验。
Wasteland是Gas Town的联邦版本。它把多个Gas Town实例联接起来,形成一个更大的协作网络。其中有一个细节我觉得值得单独拎出来讲:Stamp声誉系统。每个Agent节点都有一个基于历史行为建立的声誉分,影响它在任务分配中的优先级。这个设计的意义在于,它把信任问题内化到了系统结构里,而不是依赖外部的人工审核。
从Gas Town到Wasteland,我看到的是一个从”多Agent协作”到”Agent网络联邦”的演进路径。这两个层次是完全不同量级的复杂度,但Wasteland的设计试图让这个跨越变得可操作。
Polsia:零员工公司的真实运营
Ben Broca,独立创始人,Polsia,2百万美元ARR以上,员工数量零。
这是目前我见过的最接近”AI运营公司”这个命题的真实案例。
Polsia做的是创业孵化器业务。收费模式是每月50美元加20%的收入分成。已经服务超过1,000家公司。所有这些,一个人完成。
具体怎么做到的?Ben的做法是让一个”AI CEO”每晚运行一次,生成第二天的工作优先级和待办清单。不只是待办清单,Agent会读取邮件、分析VC的询问、起草回复。Ben自己描述的一个场景是:某天早上打开收件箱,发现Agent已经处理了三封VC的邮件,每封都写了有针对性的回复草稿,他只需要确认发送。
“孵化器模型”本身也值得注意。Polsia不是把AI用于某个垂直行业,而是用AI来运营一个批量服务多家公司的平台。规模经济在这里体现的方式和传统公司完全不同:增加1,000家服务对象不需要招聘,因为处理客户关系的是Agent,不是人。
我在想,1,000家公司、0名员工、200万美元ARR,这个数字组合在三年前大概连提案都很难写出来,因为它在商业逻辑上看起来不成立。现在它是真实存在的营收数据。
Vibe-Kanban与Symphony:瓶颈移到了哪里
当代码生成不再是瓶颈,什么变成了新的瓶颈?
Vibe-Kanban给出了一个角度。它把项目管理和Agent执行整合在一起,设计理念来自Elixir/BEAM的监督树(supervision tree):每个任务节点都有明确的父子关系,父节点负责监督子节点,子节点失败时父节点决定重启还是上报。软件世界里处理并发容错的方式,直接挪到了Agent编排里。
另一个关键文件是WORKFLOW.md。这不是README,它是给Agent看的执行规范:任务怎么拆分,上下文怎么传递,边界情况怎么处理。WORKFLOW.md的出现说明,工程师现在面对的核心挑战不是写代码,而是写能让Agent正确理解的规范。这是一种新的写作能力。
OpenAI的Symphony是一个更明确的官方表态。Symphony的定位是项目管理工具,而不是代码工具。OpenAI用这个产品说了一句清楚的话:你的工作是管理项目,不是管理代码。这个宣言背后的含义是,代码层已经被下移到Agent负责的地方,人类的精力应该集中在上面:目标、优先级、验收标准。
瓶颈从”怎么实现”移到了”想清楚要做什么”。这个移动听起来简单,但对实际工作流程的影响是系统性的。
这条路上的风险与不确定性
我不想在这里只写什么有效,因为有很多东西还没有被验证,或者已经有明确的问题需要正视。
成本结构的脆弱性。 Polsia每月50美元加20%分成的定价,依赖的是Claude API成本持续下降这个假设。如果某个季度API定价调整,单位经济学可能立刻出现压力。零员工意味着没有能吸收成本冲击的人力弹性,边际成本的变动会直接穿透到利润端。
“AI CEO”的决策盲区。 Agent每晚运行一次生成优先级听起来很高效,但它的判断依赖于输入数据的质量。如果VC邮件里有隐含的业务信号被模型误读,如果某个客户的留存问题没有在数据里体现出来,AI CEO就不知道。人类有一种很难被代替的”场感”,能从非结构化的信号里感知到某件事不对劲。这种能力目前还没有被Agent系统化地复制。
Vitalik的警告值得认真对待。 给Agent设定赚钱目标,然后让它自主运行,这个结构会产生优化压力。这个优化压力会找最短路径,而最短路径不一定是我们想要的路径。Web4 Automaton里的”非预期优化”不是一个小概率事件,在设计激励结构的时候,它应该是默认考虑的情况,而不是例外。
编排复杂度的管理成本。 Gas Town同时运行20到30个实例,每个有角色分工。这个架构在设计良好的状态下很优雅,但当某个节点出现异常,调试成本可能远高于传统的单体系统。联邦结构Wasteland更是如此,多个Gas Town之间的状态一致性、信任边界、故障传播,每一个都是真实的工程挑战。声誉系统是个好主意,但声誉数据本身被污染了怎么办?
规模上限不清楚。 1,000家公司、零员工,这是一个真实的数据点。但从1,000到10,000,或者服务复杂度提升的时候,这个模型是否线性扩展,目前没有公开的数据。有些限制可能是模型能力的天花板,有些可能是架构设计的天花板,很难在没有更多案例的情况下区分。
我花了相当多时间思考这四个项目,因为它们合在一起描述的不是某个单一的技术突破,而是一个结构性的变化:公司可以在没有员工的情况下运营,Agent可以作为经济主体存在,编排协议比具体工具更有持久价值。
这些结构里有真实的风险,有还没被验证的假设,有可能在规模化时崩溃的设计。但工程师的工作从来不是等到所有风险消失才动手。
真正的问题是:当”1个人+N个Agent”成为一种可行的公司结构,什么才是这个结构里不可被替代的部分?我的答案目前是:判断力、声誉、以及对”什么是对的”保持清醒的能力。但这个答案可能在六个月后需要修正。
参考来源
- Web4 Automaton - 自主盈利Agent网络
- Polsia - Ben Broca,零员工孵化器
- Maggie Appleton: “The Orchestration Layer” - Agent编排模式分析
- Vitalik Buterin: 关于非预期优化的评论 - 激励结构设计警告
- OpenAI Symphony 产品发布(2026年3月)- 官方项目管理定位声明
- Claude Code ARR数据来自Anthropic内部分享(2026年Q1)
订阅通讯
获取关于我最新项目、文章以及 AI 和 Web 开发实验的更新。