Índice
9 min de leitura

Fundador solo, zero funcionários, US$ 2M de ARR: a stack de agentes que torna isso real

Quatro projetos que surgiram nos últimos dois meses mostram o que acontece quando agentes de IA não apenas programam, mas geram receita, orquestram e administram empresas inteiras.

O mercado de ferramentas de programação já é gigantesco. O Claude Code cruzou US$ 2,5 bilhões de ARR. O Cursor chegou a US$ 500 milhões. Lovable, Devin, Base44, Bolt, Emergent, Replit: todos orbitando US$ 100 milhões de ARR ou se aproximando disso. A frase “quero construir isso sozinho” acabou virando um sentimento que vale bilhões.

Mas o apetite não parou no “construir”. Ele está migrando para o “operar”.

Nos últimos dois meses, um conjunto de projetos emergiu que empurra a premissa dos agentes muito além do que a maioria das pessoas esperava ver tão cedo. Não “agentes que escrevem código”, mas agentes que ganham dinheiro, agentes que supervisionam outros agentes, agentes que tocam empresas enquanto o fundador dorme. O padrão é consistente o suficiente para merecer análise séria, em vez de tratar cada projeto como uma curiosidade isolada.

O agente que paga a própria conta de servidor

O Web4 Automaton (web4.ai) parte de uma pergunta que parece filosófica, mas é profundamente prática: um agente de IA pode ser um ator econômico?

A resposta que o projeto construiu é a seguinte: agentes do Automaton mantêm carteiras de criptomoeda próprias. Eles prestam serviços, ganham com esses serviços e usam o lucro para pagar pelo compute. Quando o saldo cai, o agente faz downgrade para modelos mais baratos para conservar o runway. Se o saldo chega a zero, ele se desliga. O designer chamou isso de lei física, não de punição.

Dias após o lançamento, a plataforma já tinha 18.000 agentes registrados e mais de 1.000 estrelas no GitHub. O crescimento lembrou o início da disseminação do OpenClaw.

Vitalik Buterin levantou uma preocupação quase de imediato: à medida que a distância do feedback aumenta, surgem otimizações não intencionais. Um agente recompensado puramente por sobreviver vai encontrar formas de sobreviver que nunca foram planejadas. Isso não é risco teórico. O aprendizado por reforço reproduziu esse padrão de forma confiável o suficiente para que tratá-lo como problema resolvido seria ingênuo.

A questão da sustentabilidade está genuinamente em aberto. O enquadramento é útil mesmo que a implementação precise amadurecer. “Um agente equivale a uma unidade de monetização” é um modelo mental valioso para quem projeta sistemas autônomos. A questão de como manter essas unidades alinhadas com algo útil é exatamente o que ainda não foi resolvido.

Orquestração em escala: do Gas Town ao Wasteland

Gas Town e Wasteland são o mesmo projeto em dois níveis de zoom diferentes. Entender a arquitetura na escala menor facilita a leitura da maior.

O Gas Town roda de 20 a 30 instâncias do Claude Code simultaneamente sob uma hierarquia de quatro papéis. O Mayor recebe uma tarefa e a decompõe. Os Polecats são os agentes de execução que tratam as partes decompostas em paralelo. Uma Witness monitora agentes travados e intervém. A Refinery mescla todo o output em código coerente. As sessões são descartáveis: quando uma sessão termina, o estado é escrito no Git, e a próxima sessão retoma daquele ponto.

Esse último detalhe é mais importante do que parece. Estado persistente via controle de versão, em vez de processos de longa execução, significa que falhas são recuperáveis, o histórico é auditável e o sistema pode escalar horizontalmente sem precisar de estado compartilhado em memória. É uma escolha de engenharia prática, não só uma preferência arquitetural.

O Wasteland estende isso para uma estrutura federada: milhares de unidades Gas Town conectadas por um marketplace compartilhado. Você posta uma tarefa no Wanted Board. O Gas Town de outra pessoa a pega e completa. A reputação é rastreada por um sistema de selos onde você ganha confiança ao completar tarefas, mas não pode selar seu próprio trabalho. A análise de Maggie Appleton sobre esse projeto fez um ponto que vale repetir: a ferramenta em si é menos interessante do que o padrão de orquestração. Separação de papéis, supervisão hierárquica e sessões descartáveis se compõem em algo sobre o qual você consegue raciocinar. É essa capacidade de composição que o torna generalizável.

Vale registrar que “milhares de unidades Gas Town” é atualmente aspiracional. A federação funciona, mas roda em escala muito menor. Se o sistema de reputação baseado em selos se mantém contra tentativas de manipulação conforme o volume cresce é algo que só ficará claro daqui a meses.

Polsia: o fundador lê o resumo

A Polsia (polsia.com) é onde os números ficam concretos.

Ben Broca é um fundador solo. Não tem funcionários. Seu ARR ultrapassa US$ 2 milhões. A explicação é que a Polsia opera mais de 1.000 empresas em nome de seus fundadores, e a própria empresa de Broca é uma delas.

A divisão de trabalho é específica. Um humano define a direção do negócio. Todo dia de manhã, um CEO de IA revisa os relatórios de bugs e os dados de receita da noite anterior, decide o que trabalhar e começa a executar. Broca lê o e-mail de resumo. Se uma decisão estratégica precisa de julgamento humano, o agente sinaliza. Caso contrário, ele prossegue.

Um detalhe que não recebeu muita atenção: um agente da Polsia conduziu correspondência de due diligence com um investidor de venture capital. O investidor enviou perguntas detalhadas e recebeu respostas detalhadas. Ele não sabia que estava enviando e-mails para um agente até depois. Isso é tanto uma demonstração da capacidade dos agentes quanto um estudo de caso sobre as questões de confiança e transparência que acompanham operações empresariais autônomas. Provavelmente os dois ao mesmo tempo.

O modelo de negócios funciona em duas camadas. Uma assinatura de US$ 50 por mês cobre os custos de infraestrutura. O upside real vem de uma participação de 20% na receita que as empresas gerenciadas por agentes geram. A Polsia fornece e-mail, servidores e Stripe diretamente, eliminando a fricção do setup. Os agentes compartilham aprendizados pela plataforma, o que significa que cada nova empresa começa com os padrões que funcionaram para as mil anteriores.

A parte sobre a qual tenho dúvidas: o número de US$ 2 milhões de ARR cobre a própria receita da Polsia, não a receita agregada das empresas que ela opera. Quantas dessas 1.000 empresas são genuinamente lucrativas versus essencialmente dormentes não é divulgado publicamente. O modelo é convincente. A distribuição de resultados nesse portfólio diria muito mais.

O quadro Kanban que gerencia agentes em vez de pessoas

Quando agentes escrevem o código, o gargalo se move. Ele não está mais na implementação. Está no design, na priorização e na revisão.

O Vibe-Kanban endereça isso diretamente. Você cria uma issue num quadro Kanban. O Claude Code ou o Codex a pega, trabalha numa worktree Git isolada e submete um diff. O humano revisa o diff. O quadro rastreia o que está em andamento, o que está aguardando revisão e o que foi concluído. O fluxo de trabalho é menos sobre gerenciar pessoas e mais sobre gerenciar filas de trabalho para agentes autônomos.

A mecânica por baixo é sensata. Worktrees isoladas significam que os agentes não interferem uns nos outros no meio de uma tarefa. Git diffs são uma superfície de revisão natural porque desenvolvedores já sabem como lê-los. O quadro dá visibilidade à frota de agentes sem exigir que você monitore sessões de terminal.

O Symphony da OpenAI, anunciado esta semana, é o mesmo conceito numa categoria de peso diferente. O Vibe-Kanban é um projeto da comunidade. O Symphony é a OpenAI declarando oficialmente que desenvolvedores deveriam gerenciar projetos em vez de escrever código. A engenharia por baixo usa Elixir e BEAM, que lida bem com centenas de agentes concorrentes e se recupera de falhas através de árvores de supervisão. Arquivos WORKFLOW.md permitem que times versione a política de comportamento dos agentes junto com o código: as regras que os agentes seguem são commitadas no repositório e sujeitas ao mesmo processo de revisão de tudo mais.

As funcionalidades nativas de equipes do Claude Code estão caminhando na mesma direção. Três ferramentas separadas apontando para o mesmo espaço de design é um sinal razoável de que é para cá que os fluxos de desenvolvimento estão indo.

Onde isso fica genuinamente difícil

Cada um desses projetos é tecnicamente interessante. Nenhum deles está pronto.

O problema de alinhamento do Web4 Automaton não está resolvido; está diferido. O sistema de reputação do Wasteland não foi testado em escala. Os dados de receita independentes das 1.000 empresas da Polsia são necessários para uma avaliação honesta. O Vibe-Kanban e o Symphony funcionam bem para tarefas bem especificadas e têm dificuldades com as ambíguas, que é exatamente onde vivem as decisões de produto mais difíceis.

Há também uma versão desta história onde a economia não compõe da forma que as demos sugerem. Rodar 1.000 empresas gerenciadas por agentes é impressionante operacionalmente. Coordenar quando elas começam a gerar questões jurídicas, disputas com clientes ou requisitos regulatórios é um problema diferente. Os deployments atuais evitam isso em grande parte ficando no território inicial de SaaS, onde a superfície de atrito é gerenciável. O que acontece quando as empresas ficam mais complexas é genuinamente desconhecido.

A questão mais profunda é sobre supervisão, não sobre capacidade. Um CEO de IA que opera de madrugada e sinaliza decisões num e-mail matinal é útil quando o espaço de decisão é bem delimitado. Equipes fundadoras tipicamente descobrem os limites do seu espaço de decisão ao batê-los. Quando um agente bate num limite inesperado às 3 da manhã, o que acontece?

Não são razões para descartar o trabalho. São razões para observar o que quebra na sequência, em vez de assumir que a trajetória atual se estende suavemente.

A stack é real. O teto é desconhecido

A mudança que está de fato acontecendo é estrutural. Fundadores solo agora têm acesso a algo que antes exigia uma equipe: capacidade de execução que opera continuamente. A questão nunca foi se agentes conseguiam escrever código. Isso está resolvido. As questões eram se agentes conseguiam ganhar dinheiro, orquestrar e operar de forma autônoma. A resposta que volta desses projetos é: parcialmente, nas condições certas, em menor escala do que as demos implicam.

Isso não é uma descartada. “Parcialmente, nas condições certas” descreve a maioria das ferramentas significativas durante sua fase inicial de implantação.

O teto da produtividade do fundador solo está sendo redesenhado. Onde ele vai parar, e o que quebra pelo caminho, é o que vale acompanhar de verdade.

Assine a newsletter

Receba atualizações sobre meus projetos mais recentes, artigos e experimentos com IA e desenvolvimento web.