11 de fevereiro de 2026 3 min de leitura

A ferramenta oculta que reduz custos de tokens de navegação web de agentes IA em 100 vezes

Descubra a abordagem revolucionária do Actionbook para resolver problemas de velocidade e custos de agentes navegadores. Automatização baseada em manuais oferece 10x a velocidade e 1/100 do custo.

Eu estava honestamente cético no início.

Toda vez que eu executava automação de navegação web com agentes, demorava uma eternidade, e ver os tokens derretendo me fazia pensar “É assim que funciona?” Mais de uma vez pensei “Talvez eu devesse fazer isso sozinho”.

Mas recentemente, depois de integrar uma ferramenta de código aberto chamada Actionbook, minha perspectiva mudou completamente.

Por que os agentes navegadores são lentos

A maioria dos frameworks de agentes hoje alimenta o LLM com todo o DOM da página. Eles enchem a janela de contexto e ainda assim frequentemente não conseguem encontrar o botão que precisam clicar. É como ter um agente tateando cegamente no escuro.

Problemas principais

Uma única busca no Airbnb consome dezenas de milhares de tokens da árvore DOM
Para o GPT-5, analisar uma única página ocupa mais de 60% da janela de contexto
Quando a interface do site muda, os seletores quebram e você tem que reescrever toda a lógica do agente
LLMs alucinam (fazem suposições de ações incorretas) diante de estruturas DOM complexas

A abordagem revolucionária do Actionbook

Construído sobre o agent-browser da Vercel, este projeto adota uma abordagem diferente.

Ele comprime manuais de ações pré-organizados e seletores DOM para cada site em JSON e os injeta no contexto do LLM. Depois disso, o agente pode agir diretamente sem exploração.

Eu pessoalmente testei o cenário de busca do Airbnb apresentado nos exemplos deles, e a velocidade percebida foi quase 10 vezes mais rápida.

Vantagens principais

Uso de tokens reduzido para 1/100 usando JSON comprimido em vez de HTML completo
Quando os sites mudam, apenas atualize o manual mantendo o código do agente intacto
Compatível com qualquer LLM: GPT-5.3-Codex, Claude Opus 4.6, Gemini 3 Pro
Manuais versionados reduzem significativamente a frequência de quebras de automação

A versão Rust é melhor para produção

Embora o Actionbook tenha uma versão TypeScript, eu recomendo o actionbook-rs baseado em Rust. O binário tem 7,8 MB com tempo de inicialização de 5 ms. A versão Node.js ultrapassa 150 MB e leva mais de 500 ms para iniciar.

Além disso, ele usa sua instalação existente do Chrome ou Brave, então nenhuma instalação separada de navegador é necessária.

Vantagens do actionbook-rs

Binário de 7,8 MB vs versão TypeScript de 150 MB
Tempo de inicialização de 5 ms vs 500~800 ms
Zero dependências de runtime, pronto para pipelines CI/CD
Modo stealth e gerenciamento de cookies integrados

Registrar como skill melhora a consistência

Em vez de uso único, registrá-lo como skill em agentes de codificação como Claude Code permite automatizar tarefas web de forma consistente no mesmo nível de qualidade.

Eu executei testes repetidos e encontrei uma diferença significativa nas taxas de sucesso de tarefas antes e depois do registro do skill. Antes do registro, 2 de cada 5 tarefas falhavam; depois, as falhas se aproximaram de zero.

Impacto real

Registrar como skill do Claude Code mantém qualidade de automação web consistente (ainda mais efetivo porque não é headless)
Com tarefas repetidas, abordagens baseadas em manuais se provam mais estáveis que as baseadas em exploração

Conclusão

Como você mostra a web para seu agente determina a qualidade da automação. A era de jogar cegamente DOMs completos acabou.

Nota importante

Isso não é para testes de desenvolvimento. É otimizado para automação de navegação web. Em outras palavras, é excelente para usar com ferramentas como OpenClaw. Para testes de desenvolvimento, eu recomendo ficar com Playwright, Chrome Dev ou agent-browser.

Referências

Assine a newsletter

Receba insights sobre a IA mais recente.