Índice
4 min de lectura

La herramienta oculta que reduce los costes de tokens de navegación web de agentes IA en 100 veces

Descubre el enfoque revolucionario de Actionbook para resolver problemas de velocidad y costes de agentes navegadores. La automatización basada en manuales ofrece 10 veces más velocidad y 1/100 del coste.

Sinceramente, al principio era escéptico.

Cada vez que ejecutaba automatización de navegación web con agentes, tardaba una eternidad, y ver cómo se derretían los tokens me hacía preguntarme “¿Así es como funciona?” Más de una vez pensé “Tal vez debería hacerlo yo mismo”.

Pero recientemente, después de integrar una herramienta de código abierto llamada Actionbook, mi perspectiva cambió completamente.

Por qué los agentes navegadores son lentos

La mayoría de los frameworks de agentes hoy en día alimentan al LLM con todo el DOM de la página. Llenan la ventana de contexto y aún así a menudo no pueden encontrar el botón que necesitan hacer clic. Es como tener un agente tanteando a ciegas en la oscuridad.

Problemas clave

  • Una sola búsqueda en Airbnb consume decenas de miles de tokens del árbol DOM
  • Para GPT-5, analizar una sola página ocupa más del 60% de la ventana de contexto
  • Cuando cambia la interfaz del sitio, los selectores se rompen y hay que reescribir toda la lógica del agente
  • Los LLM alucinan (hacen suposiciones de acciones incorrectas) ante estructuras DOM complejas

El enfoque revolucionario de Actionbook

Construido sobre agent-browser de Vercel, este proyecto adopta un enfoque diferente.

Comprime manuales de acciones preorganizados y selectores DOM para cada sitio web en JSON y los inyecta en el contexto del LLM. Después de eso, el agente puede actuar directamente sin exploración.

Personalmente probé el escenario de búsqueda de Airbnb que aparece en sus ejemplos, y la velocidad percibida fue casi 10 veces más rápida.

Ventajas principales

  • Uso de tokens reducido a 1/100 usando JSON comprimido en lugar de HTML completo
  • Cuando los sitios cambian, solo actualiza el manual manteniendo intacto el código del agente
  • Compatible con cualquier LLM: GPT-5.3-Codex, Claude Opus 4.6, Gemini 3 Pro
  • Los manuales con control de versiones reducen significativamente la frecuencia de fallos de automatización

La versión Rust es mejor para producción

Aunque Actionbook tiene una versión TypeScript, recomiendo actionbook-rs basado en Rust. El binario es de 7,8 MB con un tiempo de inicio de 5 ms. La versión Node.js supera los 150 MB y tarda más de 500 ms en iniciarse.

Además, utiliza tu instalación existente de Chrome o Brave, por lo que no se necesita instalación de navegador por separado.

Ventajas de actionbook-rs

  • Binario de 7,8 MB vs versión TypeScript de 150 MB
  • Tiempo de inicio de 5 ms vs 500~800 ms
  • Cero dependencias de tiempo de ejecución, listo para pipelines CI/CD
  • Modo sigiloso y gestión de cookies incorporados

Registrarlo como habilidad mejora la consistencia

En lugar de un uso único, registrarlo como habilidad en agentes de codificación como Claude Code te permite automatizar tareas web de forma consistente al mismo nivel de calidad.

Realicé pruebas repetidas y encontré una diferencia significativa en las tasas de éxito de tareas antes y después del registro de habilidad. Antes del registro, 2 de cada 5 tareas fallaban; después, los fallos se acercaron a cero.

Impacto real

  • Registrar como habilidad de Claude Code mantiene una calidad de automatización web consistente (aún más efectivo porque no es headless)
  • Con tareas repetidas, los enfoques basados en manuales demuestran ser más estables que los basados en exploración

Conclusión

Cómo muestras la web a tu agente determina la calidad de la automatización. La era de lanzar ciegamente DOMs completos ha terminado.

Nota importante

Esto no es para pruebas de desarrollo. Está optimizado para automatización de navegación web. En otras palabras, es excelente para usar con herramientas como OpenClaw. Para pruebas de desarrollo, recomiendo seguir con Playwright, Chrome Dev o agent-browser.

Referencias

Únete al boletín

Recibe actualizaciones sobre mis últimos proyectos, artículos y experimentos con IA y desarrollo web.