2026년 3월 3일 3 분 소요 연도 2026

Claude Code 서브에이전트로 메인 세션 토큰을 25배 줄이는 법

AI가 멍청해진 게 아닙니다. 메인 세션이 과부하된 겁니다. 서브에이전트로 1시간 넘게 품질을 유지하세요.

핵심 요약

AI가 멍청해진 게 아닙니다. 메인 세션이 과부하된 겁니다. 서브에이전트로 1시간 넘게 품질을 유지하세요.

claude-code ai-agents context-engineering productivity ai

주변에서 같은 말을 계속 듣습니다. “Claude Code 쓸수록 답변이 이상해져.”

원인은 거의 항상 같습니다. 파일 읽기부터 검색까지 전부 메인 세션 하나에 몰아넣고 있거든요. 컨텍스트 윈도우에 토큰이 쌓일수록 AI는 처음과 끝 정보는 잘 보지만, 중간에 묻힌 내용을 놓치기 시작합니다. Compaction이 아닌 단순 세션 내용 이어붙이기 구조라면 최초 내용은 아예 삭제될 수도 있고요.

서브에이전트로 작업을 분리하면 메인에 쌓이는 토큰이 25분의 1로 줄 수 있습니다. 30분이면 품질이 떨어지던 세션이 1시간 넘게 유지됩니다.

이 구조를 팀에 공유한 뒤로 같은 불만이 사라졌습니다.

메인 세션에 뭐가 쌓이느냐가 답변 품질을 결정합니다

코드 3군데를 메인에서 직접 탐색하면 원문이 15,000토큰 넘게 메인에 쌓입니다. 서브에이전트 3개로 나누면 각각 200토큰짜리 요약만 메인에 돌아옵니다. 합쳐서 600토큰.

컨텍스트가 커질수록 AI는 처음과 끝은 잘 기억하지만 중간에 묻힌 정보를 점점 놓칩니다. Stanford 연구에서 이를 “Lost in the Middle”이라고 부르는데, 맥락 중간에 놓인 정보의 검색 정확도가 30% 넘게 떨어진다는 결과가 나왔습니다.

메인을 가볍게 유지하면 이 문제가 구조적으로 사라집니다. 세션 30분만 넘기면 답변이 이상해지던 팀원이 이 구조를 쓴 뒤로 1시간 넘게 세션을 유지하고 있습니다.

인라인 탐색: 메인에 15,000+토큰 vs 에이전트 요약: 600토큰
서브에이전트는 독립 공간에서 작업 후 핵심 요약만 반환
메인 맥락이 짧으면 중간 정보 누락 현상 자체가 줄어듦
30분 품질 한계 → 1시간 이상 유지 가능 (동일 품질 기준)

General 에이전트부터 쓰는 사람이 비용을 가장 많이 버립니다

기본 에이전트 타입은 4가지입니다.

Explore는 읽기 전용에 Haiku 모델 기반이라 빠르고 저렴합니다. Plan과 General은 메인 세션 모델을 그대로 씁니다. Sonnet으로 돌리고 있으면 Sonnet이고, Opus면 Opus입니다. Bash는 터미널 명령 전용입니다.

함정은 여기 있습니다. 코드 탐색이나 구조 파악처럼 읽기만 하면 되는 작업에 General을 쓰는 분이 많거든요. Explore로 코드베이스를 분석한 품질이 General과 거의 같다는 걸 아는 분이 드뭅니다.

Explore(Haiku 기반)는 General 대비 비용 80% 이상 절감
구현 작업만 General / 나머지는 전부 Explore로 충분
Plan은 아키텍처처럼 넓은 범위를 읽어야 할 때만
Bash는 테스트 실행이나 빌드 격리용

프롬프트 한 줄로 에이전트 3개 동시 실행하면 온보딩이 절반으로 줍니다

서로 의존성 없는 작업은 에이전트를 동시에 띄울 수 있습니다. “인증 시스템과 DB 구조와 API 라우트를 각각 조사해줘” 한 문장이면 Explore 3개가 동시에 돌아갑니다.

새로 합류한 팀원에게 이 패턴을 알려줬더니 코드베이스 파악이 절반 시간에 끝났습니다. 단, 같은 파일을 수정하는 작업은 절대 동시에 돌리면 안 됩니다. 충돌이 나거든요.

독립 작업은 동시에 / 의존 작업은 순서대로
같은 파일 수정은 동시 실행 금지
프롬프트에 “in parallel” 또는 “병렬로”라고 명시하면 자동 분기
동시 실행 3개 요약이 메인에 차지하는 양은 약 600토큰

Ctrl+B 하나로 테스트 돌리면서 다음 기능 바로 시작됩니다

Ctrl+B를 누르면 실행 중인 에이전트가 백그라운드로 넘어갑니다. 테스트 스위트 전체를 돌리면서 바로 다음 기능 개발에 들어갈 수 있습니다. 이걸 모르는 분은 테스트 끝날 때까지 가만히 기다리고 있더라고요.

백그라운드 에이전트는 질문을 못 하고 MCP 도구도 못 씁니다. 파일 읽기와 쓰기만 가능하지만, 테스트 실행이나 코드 리뷰에는 그걸로 충분합니다.

Ctrl+B로 현재 에이전트를 백그라운드 전환
“테스트 결과 뭐 나왔어?”로 나중에 확인
백그라운드에서는 MCP 도구 사용 불가 (파일 읽기/쓰기만 가능)
코드 리뷰를 백그라운드로 돌리고 구현 병행 가능

커스텀 에이전트 하나 만들면 여러 도구에서 재사용됩니다

.claude/agents/reviewer.md 파일 하나 만들면 됩니다. YAML 머리말에 이름과 설명과 모델만 적으면 Claude Code가 자동으로 인식합니다. 맞는 작업이 들어오면 알아서 그 에이전트로 보냅니다.

이 파일 포맷이 agentskills.io 표준과 같아서 한번 만든 에이전트를 Cursor와 Copilot과 Codex와 Gemini CLI에서도 그대로 쓸 수 있다는 게 의외의 장점입니다.

npx ai-agent-skills install code-review 한 줄이면 검증된 에이전트 47개를 바로 내려받을 수도 있습니다.

.claude/agents/ 폴더에 마크다운 파일 생성 → 자동 인식
model을 haiku로 지정하면 리뷰 비용 대폭 절감. 보안 이슈나 에러 핸들링 누락을 잡아야 하는 작업은 opus 또는 sonnet으로 지정
Claude Code와 Cursor와 Copilot과 Codex에서 호환

AI가 멍청해진 게 아닙니다

AI의 능력이 떨어진 게 아닙니다. 메인 세션에 너무 많이 쌓여서 중간 내용을 못 보는 겁니다. 서브에이전트는 AI를 더 쓰는 게 아니라 메인 세션을 지키는 구조입니다.

뉴스레터 구독하기

최신 프로젝트, 아티클, AI와 웹 개발 실험에 대한 소식을 받아보세요.