Índice
7 min de leitura

5 previsões de IA para 2026: agentes, chips e exits históricos

Do SaaSpocalypse ao silício dedicado por modelo, cinco previsões ousadas sobre o rumo da IA em 2026, com cerca de 50% de chance de acertar.

Sinceramente, pensei bastante se deveria ou não escrever um artigo de previsões. Conversar em particular com minha cofundadora Hyeonji Hwang é uma coisa; publicar é outra completamente diferente.

Se acerta, dizem “era óbvio”. Se erra, é constrangedor. Mas a velocidade dos acontecimentos desde o início de 2026 não tem nada de comum, então resolvi organizar minhas ideias.

Desenvolvedores (e todo mundo) não serão substituídos este ano, mas precisam começar a buscar novas aptidões

Como graduado em bioengenharia, uma notícia de alguns dias atrás me impactou profundamente. O custo de sequenciar o genoma humano era de US$ 2,7 bilhões há 25 anos (Projeto Genoma Humano). Há 5 anos, caiu para US$ 1.000. Nesta semana, a Element Biosciences apresentou o VITARI, um equipamento de US$ 100. Mesmo na biotecnologia, um dos campos que mais lentamente evolui, o ritmo já é esse. A maioria das indústrias vai mudar ainda mais rápido.

E o software é muito mais rápido. Na era mobile, os ciclos de troca de dispositivos nos davam tempo para nos adaptar. Com a IA, as coisas mudam diariamente. Essa é a natureza do software.

  • 2024 Proliferação do Cursor → Geração de apps full-stack com Bolt e Lovable → “Vibe coding” de Karpathy → 2025 Claude Code, Opus 4.5, Gemini 3.0 Pro → Janeiro de 2026 o SaaSpocalypse. Em apenas dois anos, chegamos aqui
  • SaaSpocalypse: Só na primeira semana de fevereiro, US$ 285 bilhões em capitalização de mercado evaporaram do setor de software. O plugin Claude Cowork da Anthropic foi o gatilho. A sensação é exatamente a mesma do início de 2023, logo após o lançamento do ChatGPT (dezembro de 2022)
  • Engenheiros de software de infraestrutura ainda são escassos nos EUA, mas outras funções já estão sendo impactadas estatisticamente. As vagas para desenvolvedores júnior caíram 45% em relação a 2023

Daqui em diante, até acompanhar o fluxo de informações será algo que só quem roda dezenas de agentes simultaneamente conseguirá fazer. Usei desenvolvedores como exemplo, mas todo mundo deveria começar a cultivar aptidões alternativas, habilidade de vendas terceirizadas, comunicação em redes sociais, gestão estável de rendimentos de investimento, etc.

O software só sobrevive como fornecedor de fontes de dados ou empacotador de planos de IA

Do ponto de vista do usuário, não importa se algo é o original ou um clone. Processos judiciais só fazem perder tempo, então os abusos estão crescendo. O que tem valor na era da IA são dados difíceis para os modelos aprenderem, mas que podem ser acessados em tempo real durante a inferência.

A tendência já estava cristalina em janeiro.

Aquisição de fontes de dados, conexão, não treinamento

  • A Perplexity se associou à BlueMatrix para integrar dados de pesquisa financeira institucional em seu produto Enterprise (anunciado em 13 de janeiro)
  • A Manus se associou à SimilarWeb, conectando dados de tráfego web/app via servidor MCP para que agentes de IA os analisem diretamente (anunciado no mesmo dia)
  • Para esse tipo de dado, torná-lo acessível funciona muito melhor do que treinar com ele. Superar empresas que acumulam dados há anos é extremamente difícil

Empacotamento de acesso a modelos, US$ 100-200/mês entregando mais de US$ 10.000 em valor

  • Claude Max a US$ 100-200/mês, ChatGPT Pro a US$ 200/mês, Higgsfield a US$ 149-249/mês, um uso que custaria US$ 200-400 via API é empacotado em planos que fazem o usuário pensar “tanto valor por esse preço?”
  • Um líder de produto da Anthropic mencionou que estão “considerando um plano de US$ 500/mês”, reflexo da forte demanda por assinaturas premium
  • Seedance 2.0, GPT-3.5-Codex, etc., oferecer acesso exclusivo a modelos mais rápido e a um preço mais eficaz do que qualquer um é o único valor restante no software de IA

A conclusão: construir uma API de dados para a primeira metade da inferência, empacotar direitos de acesso a modelos, ou fazer outsourcing empresarial mais rápido. A análise da segunda metade não faz sentido, a IA já faz melhor e mais barato.

Agentes de IA acendem o 5.º boom do hardware (o hardware agora é para AGENTES)

O OpenClaw deixou isso inequivocamente claro. Criado pelo desenvolvedor austríaco Peter Steinberger, este agente pessoal open source atingiu 60.000 estrelas no GitHub em 72 horas e já ultrapassou 145.000. Ele gerencia automaticamente e-mails, agenda, navegação web e compras via WhatsApp, Telegram e Slack. A DigitalOcean lançou um deploy com um clique e a Raspberry Pi publicou um guia oficial.

É aqui que a coisa fica interessante.

  • Agentes precisam responder instantaneamente quando o usuário precisa, então cada agente necessita de seu próprio dispositivo (ou instância)
  • Só o conceito de um agente por pessoa já dobra a demanda de computação atual. E se uma pessoa rodar 10 ou 100 agentes pessoais?
  • Um “dispositivo” = poder computacional (CPU) + armazenamento (DRAM, SSD) + rede. Rodam em servidores ou Mac Minis, cada agente/usuário em seu próprio contêiner Docker
  • Chips legados podem lidar com parte dessa carga, o que cria uma oportunidade enorme para empresas chinesas. A Samsung e a SK Hynix retomando a expansão de suas linhas de produção após hesitar pode ter a ver com isso

(Feat. Samsung, SK Hynix, TSMC, SanDisk: em comparação com o precedente da Nvidia, as avaliações podem ainda estar baratas. Mas, diferente da Nvidia, a existência da China como alternativa é a armadilha.)

Chegou a era dos chips específicos por modelo (The Model is the CHIP)

A Taalas, sediada em Toronto, revelou o HC1, um chip ASIC construído exclusivamente para o Llama 3.1 8B. O resultado: 17.000 tokens por segundo, 73× mais rápido que um Nvidia H200 e cerca de 10× mais rápido que o Cerebras. Ao gravar os pesos do modelo diretamente nos transistores, o HC1 não precisa de HBM nem de refrigeração líquida, e o consumo de energia cai para 1/10.

A Taalas já captou US$ 219 milhões no total e planeja suportar modelos de até 20 bilhões de parâmetros com o HC2.

Todo mundo dizia que esses chips nunca atingiriam eficiência energética ou escalabilidade. Mesmo assim, startups de chips especializados continuam atraindo capital massivo:

  • 24 de dezembro: a Nvidia licenciou a tecnologia LPU da Groq por US$ 20 bilhões e contratou talentos-chave (fundador Jonathan Ross, presidente Sunny Madra), na prática, uma aquisição
  • A Cerebras retirou seu IPO e captou mais de US$ 1 bilhão, mantendo sua independência
  • Chips dedicados por modelo podem se adaptar a um novo modelo em cerca de 2 meses trocando apenas duas máscaras, combinados com modelos de fronteira, podem transformar toda a estrutura de custos de inferência

Uma nova era dos semicondutores está claramente se abrindo.

Uma startup inspirada no OpenClaw protagonizará um exit histórico este ano

A base dessa previsão é um padrão que já se estabeleceu.

O padrão estabelecido: Browser-use → Manus → Aquisição pela Meta

  • Em 2025, o Browser-use (open source) demonstrou o potencial da automação com IA
  • A Manus combinou Sonnet 4 com Browser-use para abrir a era dos agentes (março de 2025)
  • Resultado: US$ 100 milhões de ARR em apenas 8 meses. Em 29 de dezembro, a Meta adquiriu a Manus por mais de US$ 2 bilhões, um dos exits unicórnio mais rápidos da história

Os ingredientes do próximo exit: OpenClaw → pi-mono → ?

  • O OpenClaw era open source. Seu criador, Peter Steinberger, confirmou sua ida para a OpenAI em 15 de fevereiro. O OpenClaw continua como fundação independente
  • O motor do OpenClaw, pi-mono (desenvolvido por Mario Zechner, ~8.900 estrelas no GitHub), está emergindo como o SDK central para serviços de agentes pessoais
  • Na China, Alibaba, Tencent e ByteDance publicaram agentes otimizados para OpenClaw. Minimax M2.5, Kimi Claw e outros estão pivotando para compatibilidade com OpenClaw
  • As expectativas dos usuários estão mudando de “perguntar ao ChatGPT” para “deixar o agente fazer”. Basta relaxar um pouco as permissões de acesso a dados e a conveniência se torna avassaladora

Estou convicto de que surgirão cerca de três serviços que aproveitam o pi-mono excepcionalmente bem, e um deles será adquirido.

Assine a newsletter

Receba atualizações sobre meus projetos mais recentes, artigos e experimentos com IA e desenvolvimento web.