Manus Adquirida pela Meta por US$ 300M Revela Princípios Essenciais de Desenvolvimento de Agentes com LangChain
A Manus compartilhou as lições duramente aprendidas na construção de agentes de IA para produção - de context rot a uma nova visão sobre avaliação - em uma apresentação conjunta com a LangChain.
A aquisição da Manus pela Meta por US$ 300 milhões vem dominando as manchetes, mas a história de verdade está no que a Manus revelou em uma apresentação conjunta com a LangChain. A palestra expôs os princípios essenciais por trás da construção de agentes de IA que realmente funcionam - e traçou uma linha clara entre os erros comuns de startups e as estratégias que de fato entregam resultado.
O Paradoxo do Context Rot
Agentes precisam de ferramentas. Mais ferramentas significam mais capacidades. Mas aqui está o problema: quanto mais ferramentas um agente usa, maior fica o seu contexto - e o desempenho degrada como consequência direta.
A Manus chama isso de Context Rot. É o paradoxo no coração do desenvolvimento de agentes: aquilo que torna seu agente mais poderoso também o torna mais burro.
A solução é Context Engineering - mostrar ao modelo apenas a informação que ele precisa para o próximo passo, nada mais.
A Manus detalhou seis técnicas específicas:
- Offload - Mover dados pesados em tokens para o sistema de arquivos em vez de mantê-los no contexto
- Reduce - Remover agressivamente informações obsoletas
- Compact - Comprimir de forma reversível dados recuperáveis (ex.: remover o conteúdo de arquivos, mas manter o caminho)
- Summarize - Comprimir informações de forma irreversível, mas sempre através de um schema estruturado
- Retrieve - Fornecer informações sob demanda por meio de busca
- Isolate - Usar subagentes com seus próprios contextos separados
O ponto-chave: gerenciamento de contexto não é uma otimização opcional. É uma decisão arquitetural central que determina se o seu agente escala ou desmorona sob o próprio peso.
Não Faça Fine-Tuning Antes do Product-Market Fit
Um dos erros de startup mais comuns que a Manus apontou: construir modelos especializados antes de encontrar o product-market fit.
O raciocínio é direto. Um modelo de propósito geral combinado com um bom context engineering permite ciclos de iteração muito mais rápidos. Quando você faz fine-tuning cedo demais, se prende a suposições sobre o comportamento do usuário que ainda não foram validadas.
O ponto mais contundente: a velocidade com que você consegue melhorar seu modelo define o teto da velocidade de inovação do seu produto. Fine-tuning desacelera esse ciclo. Context engineering mantém ele rápido.
Guarde o fine-tuning para depois de provar que o produto funciona. Antes disso, é otimização prematura da mais cara que existe.
Padrões Multi-Agente: Duas Abordagens Distintas
A Manus identificou dois padrões multi-agente fundamentais, cada um adequado a tipos diferentes de trabalho:
Padrão de Comunicação - Subagentes começam do zero. O agente principal envia uma requisição focada, o subagente processa de forma independente e retorna o resultado. Ideal para tarefas de baixo contexto e paralelizáveis, como busca em código ou recuperação de dados.
Padrão de Memória Compartilhada - Subagentes compartilham o histórico completo da conversa, mas operam com prompts e conjuntos de ferramentas diferentes. Ideal para tarefas complexas e interdependentes, como pesquisa aprofundada em que cada etapa se baseia nas anteriores.
A escolha entre eles não é sobre capacidade - é sobre requisitos de contexto. Se a subtarefa é autocontida, use Comunicação. Se ela precisa do panorama completo, use Memória Compartilhada. Errar nessa escolha significa desperdiçar tokens com contexto desnecessário ou privar agentes de informações de que eles precisam.
Um Espaço de Ação em Três Camadas para Evitar Sobrecarga de Ferramentas
Ferramentas demais confundem o modelo. A resposta da Manus é uma arquitetura em camadas que limita o que o modelo enxerga a cada momento:
Camada Atômica - 10 a 20 capacidades essenciais: ler, escrever, shell, navegador. Estão sempre disponíveis e o modelo as usa diretamente.
Utilitários do Sandbox - Ferramentas CLI pré-instaladas como conversores, linters e formatadores. O modelo as invoca pelo shell em vez de tê-las como ferramentas dedicadas.
Pacotes e APIs - Scripts Python com chaves de API pré-autenticadas. Lidam com interações de serviços externos sem expor toda a superfície da API ao modelo.
Essa estrutura em camadas mantém o espaço de decisão do modelo gerenciável. Em vez de escolher entre 200 ferramentas, ele escolhe entre 15 ações essenciais e delega todo o resto via shell. O resultado é uma seleção de ferramentas mais confiável e menos chamadas confusas ou alucinadas.
Repensando Métricas de Avaliação
Benchmarks públicos como o GAIA não refletem as preferências reais dos usuários. A posição da Manus é direta: o padrão-ouro são avaliações dos usuários em sessões concluídas, com notas de 1 a 5.
Três princípios de avaliação emergiram:
- Testes de execução em vez de testes de pergunta e resposta - O agente consegue de fato concluir a tarefa em um sandbox? Isso importa mais do que saber se ele consegue responder perguntas sobre a tarefa.
- Qualidade subjetiva exige revisão humana - Acabamento visual, tom e coerência geral não podem ser pontuados automaticamente. Uma pessoa precisa olhar o resultado.
- Scores de benchmark são necessários, mas insuficientes - Provam capacidade básica. Não provam que o produto é bom.
A Lição Central
Over-engineering é o inimigo.
Os maiores ganhos de desempenho não vêm de adicionar complexidade - vêm de removê-la. Não torne o trabalho do modelo mais difícil. Torne-o mais simples.
Esse é, sem dúvida, o motivo pelo qual a Meta pagou US$ 300 milhões pela Manus. Não por funcionalidades chamativas, mas por uma filosofia de design centrada no essencial. Eliminar o que não é necessário, gerenciar contexto com rigor e construir sistemas em que o modelo consiga focar na tarefa em vez de se afogar no próprio estado.
Os agentes que funcionam em produção não são os que têm mais capacidades. São os que fazem cada capacidade valer.
Assine a newsletter
Receba atualizações sobre meus projetos mais recentes, artigos e experimentos com IA e desenvolvimento web.