25 de fevereiro de 2026 7 min de leitura

5 previsões de IA para 2026: agentes, chips e exits históricos

Do SaaSpocalypse ao silício dedicado por modelo, cinco previsões ousadas sobre o rumo da IA em 2026, com cerca de 50% de chance de acertar.

Sinceramente, pensei bastante se deveria ou não escrever um artigo de previsões. Conversar em particular com minha cofundadora Hyeonji Hwang é uma coisa; publicar é outra completamente diferente.

Se acerta, dizem “era óbvio”. Se erra, é constrangedor. Mas a velocidade dos acontecimentos desde o início de 2026 não tem nada de comum, então resolvi organizar minhas ideias.

Desenvolvedores (e todo mundo) não serão substituídos este ano, mas precisam começar a buscar novas aptidões

Como graduado em bioengenharia, uma notícia de alguns dias atrás me impactou profundamente. O custo de sequenciar o genoma humano era de US$ 2,7 bilhões há 25 anos (Projeto Genoma Humano). Há 5 anos, caiu para US$ 1.000. Nesta semana, a Element Biosciences apresentou o VITARI, um equipamento de US$ 100. Mesmo na biotecnologia, um dos campos que mais lentamente evolui, o ritmo já é esse. A maioria das indústrias vai mudar ainda mais rápido.

E o software é muito mais rápido. Na era mobile, os ciclos de troca de dispositivos nos davam tempo para nos adaptar. Com a IA, as coisas mudam diariamente. Essa é a natureza do software.

2024 Proliferação do Cursor → Geração de apps full-stack com Bolt e Lovable → “Vibe coding” de Karpathy → 2025 Claude Code, Opus 4.5, Gemini 3.0 Pro → Janeiro de 2026 o SaaSpocalypse. Em apenas dois anos, chegamos aqui
SaaSpocalypse: Só na primeira semana de fevereiro, US$ 285 bilhões em capitalização de mercado evaporaram do setor de software. O plugin Claude Cowork da Anthropic foi o gatilho. A sensação é exatamente a mesma do início de 2023, logo após o lançamento do ChatGPT (dezembro de 2022)
Engenheiros de software de infraestrutura ainda são escassos nos EUA, mas outras funções já estão sendo impactadas estatisticamente. As vagas para desenvolvedores júnior caíram 45% em relação a 2023

Daqui em diante, até acompanhar o fluxo de informações será algo que só quem roda dezenas de agentes simultaneamente conseguirá fazer. Usei desenvolvedores como exemplo, mas todo mundo deveria começar a cultivar aptidões alternativas, habilidade de vendas terceirizadas, comunicação em redes sociais, gestão estável de rendimentos de investimento, etc.

O software só sobrevive como fornecedor de fontes de dados ou empacotador de planos de IA

Do ponto de vista do usuário, não importa se algo é o original ou um clone. Processos judiciais só fazem perder tempo, então os abusos estão crescendo. O que tem valor na era da IA são dados difíceis para os modelos aprenderem, mas que podem ser acessados em tempo real durante a inferência.

A tendência já estava cristalina em janeiro.

Aquisição de fontes de dados, conexão, não treinamento

A Perplexity se associou à BlueMatrix para integrar dados de pesquisa financeira institucional em seu produto Enterprise (anunciado em 13 de janeiro)
A Manus se associou à SimilarWeb, conectando dados de tráfego web/app via servidor MCP para que agentes de IA os analisem diretamente (anunciado no mesmo dia)
Para esse tipo de dado, torná-lo acessível funciona muito melhor do que treinar com ele. Superar empresas que acumulam dados há anos é extremamente difícil

Empacotamento de acesso a modelos, US$ 100-200/mês entregando mais de US$ 10.000 em valor

Claude Max a US$ 100-200/mês, ChatGPT Pro a US$ 200/mês, Higgsfield a US$ 149-249/mês, um uso que custaria US$ 200-400 via API é empacotado em planos que fazem o usuário pensar “tanto valor por esse preço?”
Um líder de produto da Anthropic mencionou que estão “considerando um plano de US$ 500/mês”, reflexo da forte demanda por assinaturas premium
Seedance 2.0, GPT-3.5-Codex, etc., oferecer acesso exclusivo a modelos mais rápido e a um preço mais eficaz do que qualquer um é o único valor restante no software de IA

A conclusão: construir uma API de dados para a primeira metade da inferência, empacotar direitos de acesso a modelos, ou fazer outsourcing empresarial mais rápido. A análise da segunda metade não faz sentido, a IA já faz melhor e mais barato.

Agentes de IA acendem o 5.º boom do hardware (o hardware agora é para AGENTES)

O OpenClaw deixou isso inequivocamente claro. Criado pelo desenvolvedor austríaco Peter Steinberger, este agente pessoal open source atingiu 60.000 estrelas no GitHub em 72 horas e já ultrapassou 145.000. Ele gerencia automaticamente e-mails, agenda, navegação web e compras via WhatsApp, Telegram e Slack. A DigitalOcean lançou um deploy com um clique e a Raspberry Pi publicou um guia oficial.

É aqui que a coisa fica interessante.

Agentes precisam responder instantaneamente quando o usuário precisa, então cada agente necessita de seu próprio dispositivo (ou instância)
Só o conceito de um agente por pessoa já dobra a demanda de computação atual. E se uma pessoa rodar 10 ou 100 agentes pessoais?
Um “dispositivo” = poder computacional (CPU) + armazenamento (DRAM, SSD) + rede. Rodam em servidores ou Mac Minis, cada agente/usuário em seu próprio contêiner Docker
Chips legados podem lidar com parte dessa carga, o que cria uma oportunidade enorme para empresas chinesas. A Samsung e a SK Hynix retomando a expansão de suas linhas de produção após hesitar pode ter a ver com isso

(Feat. Samsung, SK Hynix, TSMC, SanDisk: em comparação com o precedente da Nvidia, as avaliações podem ainda estar baratas. Mas, diferente da Nvidia, a existência da China como alternativa é a armadilha.)

Chegou a era dos chips específicos por modelo (The Model is the CHIP)

A Taalas, sediada em Toronto, revelou o HC1, um chip ASIC construído exclusivamente para o Llama 3.1 8B. O resultado: 17.000 tokens por segundo, 73× mais rápido que um Nvidia H200 e cerca de 10× mais rápido que o Cerebras. Ao gravar os pesos do modelo diretamente nos transistores, o HC1 não precisa de HBM nem de refrigeração líquida, e o consumo de energia cai para 1/10.

A Taalas já captou US$ 219 milhões no total e planeja suportar modelos de até 20 bilhões de parâmetros com o HC2.

Todo mundo dizia que esses chips nunca atingiriam eficiência energética ou escalabilidade. Mesmo assim, startups de chips especializados continuam atraindo capital massivo:

24 de dezembro: a Nvidia licenciou a tecnologia LPU da Groq por US$ 20 bilhões e contratou talentos-chave (fundador Jonathan Ross, presidente Sunny Madra), na prática, uma aquisição
A Cerebras retirou seu IPO e captou mais de US$ 1 bilhão, mantendo sua independência
Chips dedicados por modelo podem se adaptar a um novo modelo em cerca de 2 meses trocando apenas duas máscaras, combinados com modelos de fronteira, podem transformar toda a estrutura de custos de inferência

Uma nova era dos semicondutores está claramente se abrindo.

Uma startup inspirada no OpenClaw protagonizará um exit histórico este ano

A base dessa previsão é um padrão que já se estabeleceu.

O padrão estabelecido: Browser-use → Manus → Aquisição pela Meta

Em 2025, o Browser-use (open source) demonstrou o potencial da automação com IA
A Manus combinou Sonnet 4 com Browser-use para abrir a era dos agentes (março de 2025)
Resultado: US$ 100 milhões de ARR em apenas 8 meses. Em 29 de dezembro, a Meta adquiriu a Manus por mais de US$ 2 bilhões, um dos exits unicórnio mais rápidos da história

Os ingredientes do próximo exit: OpenClaw → pi-mono → ?

O OpenClaw era open source. Seu criador, Peter Steinberger, confirmou sua ida para a OpenAI em 15 de fevereiro. O OpenClaw continua como fundação independente
O motor do OpenClaw, pi-mono (desenvolvido por Mario Zechner, ~8.900 estrelas no GitHub), está emergindo como o SDK central para serviços de agentes pessoais
Na China, Alibaba, Tencent e ByteDance publicaram agentes otimizados para OpenClaw. Minimax M2.5, Kimi Claw e outros estão pivotando para compatibilidade com OpenClaw
As expectativas dos usuários estão mudando de “perguntar ao ChatGPT” para “deixar o agente fazer”. Basta relaxar um pouco as permissões de acesso a dados e a conveniência se torna avassaladora

Estou convicto de que surgirão cerca de três serviços que aproveitam o pi-mono excepcionalmente bem, e um deles será adquirido.

Assine a newsletter

Receba insights sobre a IA mais recente.