A ferramenta oculta que reduz custos de tokens de navegação web de agentes IA em 100 vezes
Descubra a abordagem revolucionária do Actionbook para resolver problemas de velocidade e custos de agentes navegadores. Automatização baseada em manuais oferece 10x a velocidade e 1/100 do custo.
Eu estava honestamente cético no início.
Toda vez que eu executava automação de navegação web com agentes, demorava uma eternidade, e ver os tokens derretendo me fazia pensar “É assim que funciona?” Mais de uma vez pensei “Talvez eu devesse fazer isso sozinho”.
Mas recentemente, depois de integrar uma ferramenta de código aberto chamada Actionbook, minha perspectiva mudou completamente.
Por que os agentes navegadores são lentos
A maioria dos frameworks de agentes hoje alimenta o LLM com todo o DOM da página. Eles enchem a janela de contexto e ainda assim frequentemente não conseguem encontrar o botão que precisam clicar. É como ter um agente tateando cegamente no escuro.
Problemas principais
- Uma única busca no Airbnb consome dezenas de milhares de tokens da árvore DOM
- Para o GPT-5, analisar uma única página ocupa mais de 60% da janela de contexto
- Quando a interface do site muda, os seletores quebram e você tem que reescrever toda a lógica do agente
- LLMs alucinam (fazem suposições de ações incorretas) diante de estruturas DOM complexas
A abordagem revolucionária do Actionbook
Construído sobre o agent-browser da Vercel, este projeto adota uma abordagem diferente.
Ele comprime manuais de ações pré-organizados e seletores DOM para cada site em JSON e os injeta no contexto do LLM. Depois disso, o agente pode agir diretamente sem exploração.
Eu pessoalmente testei o cenário de busca do Airbnb apresentado nos exemplos deles, e a velocidade percebida foi quase 10 vezes mais rápida.
Vantagens principais
- Uso de tokens reduzido para 1/100 usando JSON comprimido em vez de HTML completo
- Quando os sites mudam, apenas atualize o manual mantendo o código do agente intacto
- Compatível com qualquer LLM: GPT-5.3-Codex, Claude Opus 4.6, Gemini 3 Pro
- Manuais versionados reduzem significativamente a frequência de quebras de automação
A versão Rust é melhor para produção
Embora o Actionbook tenha uma versão TypeScript, eu recomendo o actionbook-rs baseado em Rust. O binário tem 7,8 MB com tempo de inicialização de 5 ms. A versão Node.js ultrapassa 150 MB e leva mais de 500 ms para iniciar.
Além disso, ele usa sua instalação existente do Chrome ou Brave, então nenhuma instalação separada de navegador é necessária.
Vantagens do actionbook-rs
- Binário de 7,8 MB vs versão TypeScript de 150 MB
- Tempo de inicialização de 5 ms vs 500~800 ms
- Zero dependências de runtime, pronto para pipelines CI/CD
- Modo stealth e gerenciamento de cookies integrados
Registrar como skill melhora a consistência
Em vez de uso único, registrá-lo como skill em agentes de codificação como Claude Code permite automatizar tarefas web de forma consistente no mesmo nível de qualidade.
Eu executei testes repetidos e encontrei uma diferença significativa nas taxas de sucesso de tarefas antes e depois do registro do skill. Antes do registro, 2 de cada 5 tarefas falhavam; depois, as falhas se aproximaram de zero.
Impacto real
- Registrar como skill do Claude Code mantém qualidade de automação web consistente (ainda mais efetivo porque não é headless)
- Com tarefas repetidas, abordagens baseadas em manuais se provam mais estáveis que as baseadas em exploração
Conclusão
Como você mostra a web para seu agente determina a qualidade da automação. A era de jogar cegamente DOMs completos acabou.
Nota importante
Isso não é para testes de desenvolvimento. É otimizado para automação de navegação web. Em outras palavras, é excelente para usar com ferramentas como OpenClaw. Para testes de desenvolvimento, eu recomendo ficar com Playwright, Chrome Dev ou agent-browser.
Referências
Assine a newsletter
Receba atualizações sobre meus projetos mais recentes, artigos e experimentos com IA e desenvolvimento web.