목록으로
3 분 소요

AI 에이전트 웹 검색 토큰 비용을 100분의 1로 줄인 숨겨진 도구

브라우저 에이전트의 느린 속도와 높은 토큰 비용 문제를 해결하는 Actionbook의 혁신적인 접근법을 소개합니다. 행동 매뉴얼 기반 자동화로 속도는 10배, 비용은 100분의 1로.

솔직히 반신반의 했습니다.

에이전트로 웹 브라우징 자동화를 돌릴 때마다 일단 오랜 시간이 소요되고, 토큰이 녹아내리는 걸 보면서 “원래 이런 건가” 싶었거든요. 그냥 제가 할까 싶은 생각이 드는 것도 한 두 번이 아니었습니다.

하지만 근래 Actionbook이라는 오픈 소스를 붙이고 나서 완전히 생각이 바뀌었어요.

브라우저 에이전트가 느린 이유

지금 대부분의 에이전트 프레임워크는 페이지 전체 DOM을 LLM에 넘깁니다. 맥락 범위를 꽉 채우고도 정작 클릭할 버튼 하나 못 찾는 경우가 많죠. 에이전트가 눈을 감고 더듬는 것과 다를 바 없는 구조입니다.

주요 문제점

  • Airbnb 검색 한 번에 DOM 트리가 수만 토큰 소비
  • GPT-5 기준 단일 페이지 파싱에 맥락 범위 60% 이상 점유
  • 사이트 UI가 바뀌면 셀렉터가 깨져서 에이전트 로직을 통째로 수정
  • LLM이 복잡한 DOM 앞에서 거짓 생성(잘못된 동작 추측)을 일으킴

Actionbook의 혁신적 접근법

Vercel의 agent-browser를 기반으로 만든 프로젝트인데 접근법이 다릅니다.

웹 사이트별로 미리 정리된 행동 매뉴얼과 DOM 셀렉터를 JSON으로 압축해서 LLM 맥락에 넣어줘요. 이후에 에이전트가 탐색할 필요 없이 바로 동작하는 거죠.

직접 대표 예시로 나온 Airbnb 검색 시나리오를 진행해봤는데 체감 속도가 10배 가까이 빨라졌습니다.

핵심 장점

  • 전체 HTML 대신 압축된 JSON으로 토큰 사용량 100분의 1 수준 감소
  • 사이트가 바뀌면 매뉴얼만 업데이트하고 에이전트 코드는 그대로 유지
  • GPT-5.3-Codex와 Claude Opus 4.6 그리고 Gemini 3 Pro 어떤 LLM이든 호환
  • 매뉴얼 버전 관리가 되니까 자동화가 깨지는 빈도가 확 줄어듦

실무에서는 Rust 버전이 더 낫습니다

Actionbook은 TypeScript 버전도 있지만 Rust 기반의 actionbook-rs를 추천합니다. 바이너리 크기가 7.8MB에 시작 시간이 5ms 수준이에요. Node.js 기반은 150MB 넘고 시작에 500ms 이상 걸리거든요.

또한 이미 깔려 있는 Chrome이나 Brave를 그대로 쓰기 때문에 별도 브라우저 설치도 필요 없습니다.

actionbook-rs의 장점

  • 바이너리 7.8MB vs TypeScript 버전 150MB
  • 시작 시간 5ms vs 500~800ms
  • 런타임 의존성 0개로 CI/CD 파이프라인에 바로 투입 가능
  • 스텔스 모드와 쿠키 관리 기본 내장

스킬 파일로 등록하면 일관성이 올라갑니다

한 번 쓰고 마는 게 아니라 Claude Code 같은 코딩 에이전트에 스킬로 등록해두면 매번 같은 품질로 웹 작업을 시킬 수 있어요.

저는 반복 테스트를 돌려봤는데 스킬 등록 전후로 작업 성공률 차이가 꽤 컸습니다. 등록 전에는 5번 중 2번 실패하던 게 거의 0에 가까워졌거든요.

실제 효과

  • Claude Code 스킬로 등록하면 웹 자동화 품질이 일정하게 유지 (headless가 아니기 때문에 더욱 가능한 부분이 있음)
  • 같은 작업을 반복할수록 행동 매뉴얼 기반이 탐색 기반보다 안정적

결론

에이전트한테 웹을 보여주는 방법이 곧 자동화 품질을 결정합니다. 무작정 DOM 전체를 던지는 시대는 끝났어요.

중요한 주의사항

다만 이는 개발 테스트용이 아닙니다. 웹 브라우징의 자동화에 최적화된 도구입니다. 즉, OpenClaw 등에 사용하기 아주 용이합니다. 개발 테스트에는 기존의 Playwright, Chrome Dev, agent-browser를 추천드립니다.

참고 링크

뉴스레터 구독하기

최신 프로젝트, 아티클, AI와 웹 개발 실험에 대한 소식을 받아보세요.