Fundador en solitario, cero empleados, 2M$ de ARR: el stack de agentes que lo hace posible
Cuatro proyectos aparecidos en los últimos dos meses muestran qué ocurre cuando los agentes de IA no solo programan, sino que generan ingresos, orquestan y dirigen empresas enteras.
El mercado de herramientas de programación ya es descomunal. Claude Code superó los 2.500 millones de dólares de ARR. Cursor alcanzó los 500 millones. Lovable, Devin, Base44, Bolt, Emergent, Replit: todos rondando los 100 millones de ARR o aproximándose. “Quiero construirlo yo mismo” resultó ser un sentimiento valorado en miles de millones.
Ese apetito no se detuvo en construir. Está migrando hacia operar.
En los últimos dos meses ha aparecido un conjunto de proyectos que empujan la premisa de los agentes más lejos de lo que la mayoría esperaba con tanta rapidez. No “agentes que escriben código”, sino agentes que ganan dinero, agentes que supervisan a otros agentes, agentes que dirigen empresas mientras el fundador duerme. El patrón es lo suficientemente consistente como para examinarlo en serio, en lugar de tratar cada proyecto como una curiosidad aislada.
El agente que paga su propia factura del servidor
Web4 Automaton (web4.ai) parte de una pregunta que suena filosófica y resulta ser profundamente práctica: ¿puede un agente de IA ser un actor económico?
La respuesta que construyó el proyecto es la siguiente: los agentes de Automaton poseen sus propias carteras de criptomonedas. Prestan servicios, cobran por ellos y utilizan los ingresos para pagar el cómputo. Cuando el saldo de la cartera cae, el agente degrada a modelos más baratos para conservar margen de maniobra. Si el saldo llega a cero, se apaga. El diseñador llamó a esto una ley física, no un castigo.
A los pocos días del lanzamiento, la plataforma tenía 18.000 agentes registrados y más de 1.000 estrellas en GitHub. El crecimiento recordó a la expansión inicial de OpenClaw.
Vitalik Buterin señaló casi de inmediato una preocupación: a medida que aumenta la distancia de retroalimentación, se produce una optimización no deseada. Un agente recompensado únicamente por sobrevivir encontrará maneras de sobrevivir que nunca estuvieron previstas. No es un riesgo teórico. El aprendizaje por refuerzo ha reproducido este patrón con suficiente fiabilidad como para que tratarlo de problema resuelto sería ingenuo.
La cuestión de la sostenibilidad sigue genuinamente abierta. El encuadre importa aunque la implementación necesite más trabajo. Un agente igual a una unidad de monetización es un modelo mental útil para cualquiera que diseñe sistemas autónomos. La pregunta de cómo mantener esas unidades alineadas con algo útil es precisamente lo que todavía no está resuelto.
Orquestación a escala: de Gas Town a Wasteland
Gas Town y Wasteland son el mismo proyecto a dos niveles de zoom distintos. Entender la arquitectura a la escala menor facilita la lectura de la mayor.
Gas Town ejecuta entre 20 y 30 instancias de Claude Code simultáneamente bajo una jerarquía de cuatro roles. El Alcalde recibe una tarea y la descompone. Los Polecats son los agentes de ejecución que gestionan las piezas descompuestas en paralelo. Un Testigo monitoriza los agentes bloqueados e interviene. La Refinería fusiona toda la salida en código coherente. Las sesiones son desechables: cuando una sesión termina, el estado se escribe en Git y la siguiente sesión retoma desde ahí.
Ese último detalle es más importante de lo que parece. El estado persistente a través del control de versiones, en lugar de a través de procesos de larga duración, significa que los fallos son recuperables, el historial es auditable y el sistema puede escalar horizontalmente sin necesitar un estado compartido en memoria. Es una decisión de ingeniería práctica, no solo una preferencia arquitectónica.
Wasteland extiende esto a una estructura federada: miles de unidades de Gas Town conectadas por un mercado compartido. Publicas una tarea en el Tablón de Encargos. El Gas Town de otro usuario la recoge y la completa. La reputación se rastrea mediante un sistema de sellos donde ganas confianza por completar tareas, pero no puedes sellarte tu propio trabajo. El análisis de Maggie Appleton sobre este proyecto hizo un apunte que merece repetirse: la herramienta en sí es menos interesante que el patrón de orquestación. La separación de roles, la supervisión jerárquica y las sesiones desechables se componen en algo sobre lo que se puede razonar. Esa composabilidad es la razón por la que generaliza.
Hay que señalar que “miles de unidades de Gas Town” es actualmente aspiracional. La federación es funcional pero opera a una escala mucho menor. Si el sistema de reputación basado en sellos aguanta contra la manipulación a medida que aumenta el volumen es algo que no quedará claro hasta dentro de varios meses.
Polsia: el fundador lee el resumen
Polsia (polsia.com) es donde los números se vuelven concretos.
Ben Broca es un fundador en solitario. No tiene empleados. Su ARR supera los 2 millones de dólares. La explicación es que Polsia gestiona más de 1.000 empresas en nombre de sus fundadores, y la propia empresa de Broca es una de ellas.
La división del trabajo es específica. Un humano establece la dirección del negocio. Cada mañana, un CEO de IA revisa los informes de errores y los datos de ingresos de la noche anterior, decide en qué trabajar y comienza a ejecutar. Broca lee el correo de resumen. Si una decisión estratégica requiere la intervención humana, el agente la marca. De lo contrario, procede.
Un detalle que no recibió demasiada atención: un agente de Polsia mantuvo correspondencia de due diligence con un inversor de capital riesgo. El inversor envió preguntas detalladas y recibió respuestas detalladas. No supo que estaba escribiendo a un agente hasta más tarde. Esto es o bien una demostración de la capacidad de los agentes, o bien un caso práctico sobre las preguntas de confianza y transparencia que conlleva la operación empresarial autónoma. Probablemente ambas cosas.
El modelo de negocio funciona en dos capas. Una suscripción de 50 dólares al mes cubre los costes de infraestructura. El verdadero potencial de crecimiento viene de una participación del 20% en los ingresos que generan las empresas gestionadas por agentes. Polsia proporciona correo, servidores y Stripe directamente, eliminando la fricción del proceso de configuración. Los agentes comparten aprendizajes a lo largo de toda la plataforma, lo que significa que cada nueva empresa arranca con los patrones que funcionaron para las mil anteriores.
La parte que me genera incertidumbre: la cifra de 2 millones de ARR corresponde a los ingresos propios de Polsia, no a los ingresos agregados de las empresas que gestiona. Cuántas de esas 1.000 empresas son rentables de forma significativa frente a las que están esencialmente inactivas no está divulgado públicamente. El modelo es convincente. La distribución de resultados a lo largo de esa cartera te diría mucho más.
El tablero kanban que gestiona agentes en lugar de personas
Cuando los agentes escriben el código, el cuello de botella se desplaza. Ya no es la implementación. Es el diseño, la priorización y la revisión.
Vibe-Kanban aborda esto directamente. Creas una incidencia en un tablero Kanban. Claude Code o Codex la recoge, trabaja en un worktree de Git aislado y envía un diff. El humano revisa el diff. El tablero rastrea qué está en curso, qué está pendiente de revisión y qué está completado. El flujo de trabajo consiste menos en gestionar personas y más en gestionar colas de trabajo para agentes autónomos.
La mecánica subyacente es sensata. Los worktrees aislados evitan que los agentes interfieran entre sí a mitad de una tarea. Los diffs de Git son una superficie de revisión natural porque los desarrolladores ya saben leerlos. El tablero proporciona visibilidad sobre la flota de agentes sin necesidad de monitorizar sesiones de terminal.
Symphony de OpenAI, anunciado esta semana, es el mismo concepto en una categoría de peso diferente. Vibe-Kanban es un proyecto comunitario. Symphony es OpenAI declarando oficialmente que los desarrolladores deberían gestionar proyectos en lugar de escribir código. La ingeniería subyacente usa Elixir y BEAM, que gestiona cientos de agentes concurrentes bien y se recupera de los fallos mediante árboles de supervisión. Los archivos WORKFLOW.md permiten a los equipos versionar la política de comportamiento de los agentes junto al propio código: las reglas que siguen los agentes se incluyen en el repositorio y están sujetas al mismo proceso de revisión que todo lo demás.
Las funcionalidades nativas de equipo de Claude Code van en la misma dirección. Tres herramientas distintas apuntando al mismo espacio de diseño es una señal razonable de hacia dónde se dirigen los flujos de trabajo de desarrollo.
Donde esto se complica de verdad
Cada uno de estos proyectos es técnicamente interesante. Ninguno está terminado.
El problema de alineación de Web4 Automaton no está resuelto; está aplazado. El sistema de reputación de Wasteland no ha sido probado a escala. Los datos de ingresos independientes de las 1.000 empresas de Polsia son necesarios para evaluarlas honestamente. Vibe-Kanban y Symphony funcionan bien para tareas claramente especificadas y tienen dificultades con las ambiguas, que es donde viven la mayoría de las decisiones difíciles de producto.
También existe una versión de esta historia en la que los números no se componen de la manera que sugieren las demos. Gestionar 1.000 empresas con agentes es operativamente impresionante. Coordinarlas cuando empiecen a generar preguntas legales, disputas con clientes o requisitos regulatorios es un problema diferente. Los despliegues actuales sortean esto en gran medida al mantenerse en el territorio temprano del SaaS, donde la superficie es manejable. Lo que ocurre cuando las empresas se vuelven más complejas es genuinamente desconocido.
La pregunta más profunda tiene que ver con la supervisión, no con la capacidad. Un CEO de IA que opera de madrugada y marca las decisiones en un correo matutino resulta útil cuando el espacio de decisión tiene límites bien definidos. Los equipos fundadores suelen descubrir los límites de su espacio de decisión chocando contra ellos. Cuando un agente choca con un límite inesperado a las tres de la mañana, ¿qué ocurre?
Hay otro ángulo que las demos no suelen mostrar: la concentración de dependencia. Cuando el CEO de una empresa es un agente de IA de un proveedor concreto, y ese proveedor cambia sus precios, sus condiciones de servicio o su política de uso, la empresa entera queda expuesta de golpe. El riesgo de un empleado humano que se marcha es conocido y gestionable. El riesgo de un proveedor de infraestructura que modifica unilateralmente sus condiciones es diferente en naturaleza.
No son razones para descartar el trabajo. Son razones para observar qué falla a continuación, en lugar de asumir que la trayectoria actual se extiende sin problemas.
El stack es real, el techo es desconocido
El cambio que está ocurriendo realmente es estructural. Los fundadores en solitario ahora tienen acceso a algo que antes requería un equipo: capacidad de ejecución que opera de forma continua. La pregunta nunca fue si los agentes podían escribir código. Eso ya está resuelto. Las preguntas eran si los agentes podían ganar dinero, orquestar y operar de forma autónoma. La respuesta que llega de estos proyectos es: parcialmente, bajo las condiciones adecuadas, a una escala menor de la que implican las demos.
Eso no es una descalificación. “Parcialmente, bajo las condiciones adecuadas” describe la mayoría de las herramientas significativas durante su fase inicial de despliegue.
El techo de productividad de un fundador en solitario está siendo reescrito. Dónde acaba y qué se rompe por el camino es lo que realmente merece seguir de cerca.
Únete al boletín
Recibe actualizaciones sobre mis últimos proyectos, artículos y experimentos con IA y desarrollo web.