2026년 2월 11일 3 분 소요

AI 에이전트 웹 검색 토큰 비용을 100분의 1로 줄인 숨겨진 도구

브라우저 에이전트의 느린 속도와 높은 토큰 비용 문제를 해결하는 Actionbook의 혁신적인 접근법을 소개합니다. 행동 매뉴얼 기반 자동화로 속도는 10배, 비용은 100분의 1로.

솔직히 반신반의 했습니다.

에이전트로 웹 브라우징 자동화를 돌릴 때마다 일단 오랜 시간이 소요되고, 토큰이 녹아내리는 걸 보면서 “원래 이런 건가” 싶었거든요. 그냥 제가 할까 싶은 생각이 드는 것도 한 두 번이 아니었습니다.

하지만 근래 Actionbook이라는 오픈 소스를 붙이고 나서 완전히 생각이 바뀌었어요.

브라우저 에이전트가 느린 이유

지금 대부분의 에이전트 프레임워크는 페이지 전체 DOM을 LLM에 넘깁니다. 맥락 범위를 꽉 채우고도 정작 클릭할 버튼 하나 못 찾는 경우가 많죠. 에이전트가 눈을 감고 더듬는 것과 다를 바 없는 구조입니다.

Vercel의 agent-browser를 기반으로 만든 프로젝트인데 접근법이 다릅니다.

웹 사이트별로 미리 정리된 행동 매뉴얼과 DOM 셀렉터를 JSON으로 압축해서 LLM 맥락에 넣어줘요. 이후에 에이전트가 탐색할 필요 없이 바로 동작하는 거죠.

직접 대표 예시로 나온 Airbnb 검색 시나리오를 진행해봤는데 체감 속도가 10배 가까이 빨라졌습니다.

Actionbook은 TypeScript 버전도 있지만 Rust 기반의 actionbook-rs를 추천합니다. 바이너리 크기가 7.8MB에 시작 시간이 5ms 수준이에요. Node.js 기반은 150MB 넘고 시작에 500ms 이상 걸리거든요.

또한 이미 깔려 있는 Chrome이나 Brave를 그대로 쓰기 때문에 별도 브라우저 설치도 필요 없습니다.

한 번 쓰고 마는 게 아니라 Claude Code 같은 코딩 에이전트에 스킬로 등록해두면 매번 같은 품질로 웹 작업을 시킬 수 있어요.

저는 반복 테스트를 돌려봤는데 스킬 등록 전후로 작업 성공률 차이가 꽤 컸습니다. 등록 전에는 5번 중 2번 실패하던 게 거의 0에 가까워졌거든요.

에이전트한테 웹을 보여주는 방법이 곧 자동화 품질을 결정합니다. 무작정 DOM 전체를 던지는 시대는 끝났어요.

다만 이는 개발 테스트용이 아닙니다. 웹 브라우징의 자동화에 최적화된 도구입니다. 즉, OpenClaw 등에 사용하기 아주 용이합니다. 개발 테스트에는 기존의 Playwright, Chrome Dev, agent-browser를 추천드립니다.

최신 프로젝트, 아티클, AI와 웹 개발 실험에 대한 소식을 받아보세요.