5 predicciones de IA para 2026: agentes, chips y exits históricos
Del SaaSpocalypse al silicio dedicado por modelo, cinco predicciones audaces sobre hacia dónde se dirige la IA en 2026, con aproximadamente un 50 % de probabilidad de acertar.
Sinceramente, dudé mucho si escribir o no un artículo de predicciones. Comentarlo en privado con mi cofundadora Hyeonji Hwang es una cosa; publicarlo es otra muy distinta.
Si aciertas, dicen “era obvio”. Si te equivocas, es embarazoso. Pero el ritmo de los acontecimientos desde principios de 2026 es de todo menos normal, así que he decidido poner en orden mis ideas.
Los desarrolladores (y todas las personas) no serán reemplazados este año, pero deben empezar a buscar nuevas aptitudes
Como graduado en bioingeniería, una noticia de hace unos días me impactó profundamente. El coste de secuenciar el genoma humano era de 2.700 millones de dólares hace 25 años (Proyecto Genoma Humano). Hace 5 años bajó a 1.000 $. Esta semana, Element Biosciences presentó VITARI, un equipo de 100 $. Incluso en la biotecnología , uno de los sectores que más lento evoluciona, el ritmo ya es este. La mayoría de las industrias cambiarán aún más rápido.
Y el software es mucho más rápido. En la era móvil, los ciclos de renovación de dispositivos nos daban tiempo para adaptarnos. Con la IA, las cosas cambian a diario. Esa es la naturaleza del software.
- 2024 Proliferación de Cursor → Generación de apps full-stack con Bolt y Lovable → “Vibe coding” de Karpathy → 2025 Claude Code, Opus 4.5, Gemini 3.0 Pro → Enero de 2026 el SaaSpocalypse. En solo dos años hemos llegado aquí
- SaaSpocalypse: Solo en la primera semana de febrero, 285.000 millones de dólares en capitalización bursátil se evaporaron del sector software. El plugin Claude Cowork de Anthropic fue el detonante. La sensación es exactamente la misma que a principios de 2023, justo después del lanzamiento de ChatGPT (diciembre 2022)
- Los ingenieros de software de infraestructura siguen siendo escasos en EE. UU., pero otros roles ya están sufriendo estadísticamente. Las ofertas de empleo para desarrolladores junior han caído un 45 % respecto a 2023
A partir de ahora, incluso mantenerse al día con el flujo de información será algo que solo podrán hacer los pocos que ejecutan decenas de agentes simultáneamente. Usé a los desarrolladores como ejemplo, pero todos deberían empezar a cultivar aptitudes alternativas: capacidad de venta en outsourcing, comunicación en redes sociales, gestión estable de ingresos por inversión, etc.
El software solo sobrevive como proveedor de datos o empaquetador de planes de IA
Desde la perspectiva del usuario, no importa si algo es el original o un clon. Las demandas judiciales solo hacen perder tiempo, así que los abusos van en aumento. Lo que tiene valor en la era de la IA son los datos que son difíciles de aprender para los modelos pero que pueden consultarse en tiempo real durante la inferencia.
La tendencia ya era cristalina en enero.
Adquisición de fuentes de datos, conexión, no entrenamiento
- Perplexity se asoció con BlueMatrix para integrar datos de investigación financiera institucional en su producto Enterprise (anunciado el 13 de enero)
- Manus se asoció con SimilarWeb, conectando datos de tráfico web/app mediante un servidor MCP para que los agentes de IA los analicen directamente (anunciado el mismo día)
- Para este tipo de datos, hacerlos accesibles es mucho más eficaz que entrenar con ellos. Superar a empresas que han acumulado datos durante años es extremadamente difícil
Empaquetado de acceso a modelos, 100-200 $/mes que aportan más de 10.000 $ en valor
- Claude Max a 100-200 $/mes, ChatGPT Pro a 200 $/mes, Higgsfield a 149-249 $/mes, un uso que costaría 200-400 $ por API se empaqueta en planes que hacen pensar al usuario “¿tanto valor por este precio?”
- Un líder de producto de Anthropic mencionó que están “considerando un plan de 500 $/mes”, reflejo de la fuerte demanda de suscripciones premium
- Seedance 2.0, GPT-3.5-Codex, etc., ofrecer acceso exclusivo a modelos más rápido y a un precio más efectivo que nadie es el único valor que queda en el software de IA
La conclusión: construir una API de datos utilizable en la primera mitad de la inferencia, empaquetar derechos de acceso a modelos, o hacer outsourcing empresarial más rápido. El análisis de la segunda mitad no tiene sentido: la IA ya lo hace mejor y más barato.
Los agentes de IA encienden el 5.º boom del hardware (el hardware ahora es para AGENTES)
OpenClaw lo dejó meridianamente claro. Creado por el desarrollador austriaco Peter Steinberger, este agente personal de código abierto alcanzó 60.000 estrellas en GitHub en 72 horas y ya supera las 145.000. Gestiona automáticamente el email, la agenda, la navegación web y las compras a través de WhatsApp, Telegram y Slack. DigitalOcean lanzó un despliegue con un clic y Raspberry Pi publicó una guía oficial.
Aquí es donde se complica.
- Los agentes deben responder al instante cuando el usuario los necesita, por lo que cada agente requiere su propio dispositivo (o instancia)
- Solo el concepto de un agente por persona ya duplica la demanda de computación actual. ¿Y si una persona ejecuta 10 o 100 agentes personales?
- Un “dispositivo” = potencia de cómputo (CPU) + almacenamiento (DRAM, SSD) + red. Se ejecutan en servidores o Mac Minis, cada agente/usuario en su propio contenedor Docker
- Chips legacy pueden manejar parte de esta carga, lo que crea una oportunidad enorme para las empresas chinas. Que Samsung y SK Hynix reanudaran la expansión de sus líneas de producción tras dudar puede estar relacionado con esto
(Feat. Samsung, SK Hynix, TSMC, SanDisk: en comparación con el precedente de Nvidia, las valoraciones podrían seguir siendo atractivas. Pero a diferencia de Nvidia, la existencia de China como alternativa es la trampa.)
Ha llegado la era de los chips específicos por modelo (The Model is the CHIP)
Taalas, con sede en Toronto, desveló el HC1, un chip ASIC diseñado exclusivamente para Llama 3.1 8B. El resultado: 17.000 tokens por segundo, 73× más rápido que un Nvidia H200 y aproximadamente 10× más rápido que Cerebras. Al grabar los pesos del modelo directamente en los transistores, el HC1 no necesita HBM ni refrigeración líquida, y el consumo energético se reduce a 1/10.
Taalas ha recaudado 219 millones de dólares en total y planea soportar modelos de hasta 20.000 millones de parámetros con el HC2.
Todo el mundo decía que estos chips nunca alcanzarían la eficiencia energética ni la escalabilidad. Sin embargo, las startups de chips especializados siguen atrayendo capital masivo:
- 24 de diciembre: Nvidia licenció la tecnología LPU de Groq por 20.000 millones de dólares y fichó a talentos clave (fundador Jonathan Ross, presidente Sunny Madra), de facto, una adquisición
- Cerebras retiró su OPV y recaudó más de 1.000 millones de dólares, manteniendo su independencia
- Los chips dedicados por modelo pueden adaptarse a un nuevo modelo en unos 2 meses cambiando solo dos máscaras, combinados con modelos frontera, podrían transformar toda la estructura de costes de inferencia
Una nueva era de semiconductores se está abriendo claramente.
Una startup inspirada en OpenClaw protagonizará un exit histórico este año
La base de esta predicción es un patrón ya establecido.
El patrón establecido: Browser-use → Manus → Adquisición por Meta
- En 2025, Browser-use (código abierto) demostró el potencial de la automatización con IA
- Manus combinó Sonnet 4 con Browser-use para abrir la era de los agentes (marzo de 2025)
- Resultado: 100 M$ de ARR en solo 8 meses. El 29 de diciembre, Meta adquirió Manus por más de 2.000 millones de dólares, uno de los exits unicornio más rápidos de la historia
Los ingredientes del próximo exit: OpenClaw → pi-mono → ?
- OpenClaw era código abierto. Su creador, Peter Steinberger, confirmó su incorporación a OpenAI el 15 de febrero. OpenClaw continúa como fundación independiente
- El motor de OpenClaw, pi-mono (desarrollado por Mario Zechner, ~8.900 estrellas en GitHub), está emergiendo como el SDK central para servicios de agentes personales
- En China, Alibaba, Tencent y ByteDance han publicado agentes optimizados para OpenClaw. Minimax M2.5, Kimi Claw y otros están pivotando hacia la compatibilidad con OpenClaw
- Las expectativas de los usuarios están pasando de “preguntar a ChatGPT” a “que el agente lo haga”. Con solo relajar ligeramente los permisos de acceso a datos, la comodidad se vuelve abrumadora
Estoy convencido de que aparecerán unos tres servicios que aprovechen pi-mono excepcionalmente bien, y que uno de ellos será adquirido.
Únete al boletín
Recibe actualizaciones sobre mis últimos proyectos, artículos y experimentos con IA y desarrollo web.