5 predicciones de IA para 2026: agentes, chips y exits históricos
Del SaaSpocalypse al silicio dedicado por modelo, cinco predicciones audaces sobre hacia dónde va la IA en 2026, con más o menos un 50 % de probabilidad de pegarle.
La verdad, dudé bastante si escribir o no un artículo de predicciones. Platicarlo en privado con mi cofundadora Hyeonji Hwang es una cosa; publicarlo es otra muy diferente.
Si le atinas, dicen “eso estaba cantado”. Si le fallas, es penoso. Pero el ritmo de lo que ha pasado desde inicios de 2026 no tiene nada de normal, así que decidí poner mis ideas en orden.
Los desarrolladores (y todos los demás) no van a ser reemplazados este año, pero deben empezar a buscar nuevas aptitudes
Como egresado de bioingeniería, una noticia de hace unos días me pegó fuerte. El costo de secuenciar el genoma humano era de 2,700 millones de dólares hace 25 años (Proyecto Genoma Humano). Hace 5 años bajó a 1,000 dólares. Esta semana, Element Biosciences presentó VITARI, un equipo de 100 dólares. Incluso en la biotecnología , uno de los campos que más lento evoluciona, el ritmo ya es este. La mayoría de las industrias van a cambiar aún más rápido.
Y el software va mucho más rápido. En la era móvil, los ciclos de renovación de dispositivos nos daban tiempo para adaptarnos. Con la IA, las cosas cambian día con día. Esa es la naturaleza del software.
- 2024 Proliferación de Cursor → Generación de apps full-stack con Bolt y Lovable → “Vibe coding” de Karpathy → 2025 Claude Code, Opus 4.5, Gemini 3.0 Pro → Enero 2026 el SaaSpocalypse. En solo dos años llegamos hasta acá
- SaaSpocalypse: Nada más en la primera semana de febrero, 285,000 millones de dólares en capitalización bursátil se evaporaron del sector de software. El plugin Claude Cowork de Anthropic fue el detonante. La sensación es exactamente la misma que a inicios de 2023, justo después del lanzamiento de ChatGPT (diciembre 2022)
- Los ingenieros de software de infraestructura siguen siendo escasos en EE. UU., pero otros roles ya están sufriendo estadísticamente. Las vacantes para desarrolladores junior cayeron un 45 % respecto a 2023
De aquí en adelante, hasta mantenerse al corriente con el flujo de información va a ser algo que solo puedan hacer los pocos que corran decenas de agentes al mismo tiempo. Usé a los desarrolladores como ejemplo, pero todos deberían empezar a cultivar aptitudes alternativas: capacidad de venta en outsourcing, comunicación en redes sociales, gestión estable de rendimientos de inversión, etc.
El software solo sobrevive como proveedor de fuentes de datos o empaquetador de planes de IA
Desde el punto de vista del usuario, no importa si algo es el original o un clon. Las demandas solo hacen perder tiempo, así que los abusos van en aumento. Lo que tiene valor en la era de la IA son los datos que a los modelos les cuesta aprender pero que se pueden jalar en tiempo real durante la inferencia.
La tendencia ya estaba clarísima en enero.
Adquisición de fuentes de datos, conexión, no entrenamiento
- Perplexity se asoció con BlueMatrix para integrar datos de investigación financiera institucional en su producto Enterprise (anunciado el 13 de enero)
- Manus se asoció con SimilarWeb, conectando datos de tráfico web/app a través de un servidor MCP para que los agentes de IA los analicen directo (anunciado el mismo día)
- Para este tipo de datos, hacerlos accesibles funciona mucho mejor que entrenar con ellos. Superar a empresas que llevan años acumulando datos es extremadamente difícil
Empaquetado de acceso a modelos, 100-200 dólares/mes que entregan más de 10,000 dólares en valor
- Claude Max a 100-200 dólares/mes, ChatGPT Pro a 200 dólares/mes, Higgsfield a 149-249 dólares/mes, un uso que costaría 200-400 dólares por API se empaqueta en planes que hacen pensar al usuario “¿tanto valor por este precio?”
- Un líder de producto de Anthropic mencionó que están “considerando un plan de 500 dólares/mes”, reflejo de la fuerte demanda de suscripciones premium
- Seedance 2.0, GPT-3.5-Codex, etc., ofrecer acceso exclusivo a modelos más rápido y a mejor precio que nadie es el único valor que le queda al software de IA
La conclusión: armar una API de datos para la primera mitad de la inferencia, empaquetar derechos de acceso a modelos, o hacer outsourcing empresarial más rápido. El análisis de la segunda mitad no tiene sentido: la IA ya lo hace mejor y más barato.
Los agentes de IA encienden el 5.° boom del hardware (el hardware ahora es para AGENTES)
OpenClaw lo dejó más que claro. Creado por el desarrollador austriaco Peter Steinberger, este agente personal de código abierto llegó a 60,000 estrellas en GitHub en 72 horas y ya supera las 145,000. Gestiona automáticamente el correo, la agenda, la navegación web y las compras a través de WhatsApp, Telegram y Slack. DigitalOcean lanzó un deploy con un clic y Raspberry Pi publicó una guía oficial.
Aquí es donde se pone interesante.
- Los agentes deben responder al instante cuando el usuario los necesita, así que cada agente requiere su propio dispositivo (o instancia)
- Solo el concepto de un agente por persona ya duplica la demanda de cómputo actual. ¿Y si una persona corre 10 o 100 agentes personales?
- Un “dispositivo” = poder de cómputo (CPU) + almacenamiento (DRAM, SSD) + red. Corren en servidores o Mac Minis, cada agente/usuario en su propio contenedor Docker
- Chips legacy pueden manejar parte de esta carga, lo que crea una oportunidad enorme para las empresas chinas. Que Samsung y SK Hynix hayan retomado la expansión de sus líneas de producción después de dudar quizás tenga que ver con esto
(Feat. Samsung, SK Hynix, TSMC, SanDisk: en comparación con el caso de Nvidia, las valuaciones podrían seguir siendo atractivas. Pero a diferencia de Nvidia, la existencia de China como alternativa es la trampa.)
Llegó la era de los chips específicos por modelo (The Model is the CHIP)
Taalas, con sede en Toronto, presentó el HC1, un chip ASIC diseñado exclusivamente para Llama 3.1 8B. El resultado: 17,000 tokens por segundo, 73× más rápido que un Nvidia H200 y unas 10× más rápido que Cerebras. Al grabar los pesos del modelo directo en los transistores, el HC1 no necesita HBM ni refrigeración líquida, y el consumo de energía se reduce a 1/10.
Taalas ha levantado 219 millones de dólares en total y planea soportar modelos de hasta 20,000 millones de parámetros con el HC2.
Todos decían que estos chips nunca lograrían la eficiencia energética ni la escalabilidad. Sin embargo, las startups de chips especializados siguen atrayendo capital de a montones:
- 24 de diciembre: Nvidia licenció la tecnología LPU de Groq por 20,000 millones de dólares y contrató talentos clave (fundador Jonathan Ross, presidente Sunny Madra), de facto, una adquisición
- Cerebras retiró su IPO y levantó más de 1,000 millones de dólares, manteniendo su independencia
- Los chips dedicados por modelo pueden adaptarse a un nuevo modelo en unos 2 meses cambiando solo dos máscaras, combinados con modelos de frontera, podrían transformar toda la estructura de costos de inferencia
Una nueva era de semiconductores está abriéndose claramente.
Una startup al estilo OpenClaw protagonizará un exit histórico este año
La base de esta predicción es un patrón ya establecido.
El patrón establecido: Browser-use → Manus → Adquisición por Meta
- En 2025, Browser-use (código abierto) demostró el potencial de la automatización con IA
- Manus combinó Sonnet 4 con Browser-use para abrir la era de los agentes (marzo 2025)
- Resultado: 100 MDD de ARR en solo 8 meses. El 29 de diciembre, Meta adquirió Manus por más de 2,000 millones de dólares, uno de los exits unicornio más rápidos de la historia
Los ingredientes del siguiente exit: OpenClaw → pi-mono → ?
- OpenClaw era código abierto. Su creador, Peter Steinberger, confirmó su entrada a OpenAI el 15 de febrero. OpenClaw sigue como fundación independiente
- El motor de OpenClaw, pi-mono (desarrollado por Mario Zechner, ~8,900 estrellas en GitHub), está surgiendo como el SDK central para servicios de agentes personales
- En China, Alibaba, Tencent y ByteDance publicaron agentes optimizados para OpenClaw. Minimax M2.5, Kimi Claw y otros están pivoteando hacia la compatibilidad con OpenClaw
- Las expectativas de los usuarios están pasando de “preguntarle a ChatGPT” a “que el agente lo haga”. Con solo aflojar un poco los permisos de acceso a datos, la conveniencia se vuelve aplastante
Estoy convencido de que van a aparecer unos tres servicios que aprovechen pi-mono excepcionalmente bien, y que uno de ellos será adquirido.
Unite al boletín
Recibí actualizaciones sobre mis últimos proyectos, artículos y experimentos con IA y desarrollo web.