2026年3月3日 1 分で読めます年 2026

Claude Codeのサブエージェントでメインセッションのトークンを25分の1に削減する

AIの精度が落ちているわけじゃない。メインセッションが過負荷になっているだけ。サブエージェントで1時間以上、高精度を維持する方法。

クイック要約

AIの精度が落ちているわけじゃない。メインセッションが過負荷になっているだけ。サブエージェントで1時間以上、高精度を維持する方法。

AIエージェント＆開発者ツール Markdownで表示 Tony Lee ブログ

claude-code ai-agents context-engineering productivity ai

同じ不満を何度も耳にする。「Claude Codeは使えば使うほど精度が落ちる」と。

原因はほぼ例外なく同じだ。ファイルの読み込み、検索、コードの探索——すべてが一つのメインセッションに積み上げられている。コンテキストウィンドウにトークンが溜まるにつれ、AIは先頭と末尾の情報は保持できるが、中間に埋もれた内容を見落とし始める。単純なメッセージ結合で動いているセッションなら、最初のほうの内容が完全に切り捨てられることもある。

サブエージェントはこの構図を変える。独立したエージェントプロセスに作業を委譲することで、メインセッションに流れ込むトークン量を最大25分の1に抑えられる。以前なら30分で劣化し始めていたセッションが、同じ品質レベルで1時間以上持続するようになる。

このパターンをチームに共有したところ、不満の声はぴたりと止んだ。

メインセッションに何が入るかで回答品質が決まる

メインセッションで3つのファイルを直接読み込めば、1万5千トークン以上の生のソースコードがコンテキストに流れ込む。同じ作業を3つのサブエージェントに任せれば、それぞれが200トークン程度の要約を返してくる。メインへの流入は合計600トークンで済む。

コンテキストウィンドウが大きくなるほど、AIは先頭と末尾の処理は得意になるが、中間の情報処理は逆に苦手になる。スタンフォードの研究者たちはこれを「Lost in the Middle（中間の迷子）」と呼んでいる——長いコンテキストの中間に置かれた情報の検索精度は30%以上低下するという。

メインセッションをスリムに保つことで、この問題を構造的に解消できる。以前は30分で品質が落ちていたあるチームメンバーも、このアプローチ後は1時間以上問題なくセッションを継続できるようになった。

インライン探索: メインに1万5千トークン以上 vs エージェント要約: 600トークン
サブエージェントは独立したコンテキストで動き、必要な情報だけを返す
メインのコンテキストが短ければ、中間の盲点が生まれにくい
品質の天井が30分 → 同一品質で1時間以上のセッションへ

Generalエージェントから始めると最もコストを無駄にする

ビルトインのエージェントタイプは4種類ある。

Exploreは読み取り専用でHaikuで動く——速くて安い。PlanとGeneralはメインセッションのモデルを引き継ぐ。Sonnetを使っているならSonnetで、OpusならOpusでExploreが動く。Bashはターミナルコマンド専用だ。

ここに落とし穴がある。多くの人が、コードの探索や構造分析、パターン検索など「読むだけ」で済む作業にGeneralを使っている。Exploreがほぼ同じ結果をはるかに低コストで出せることに気づいていない人が多い。

Explore（Haiku）はGeneralと比べて80%以上のコスト削減になる
Generalは実装作業にだけ使う。それ以外はExploreで十分
Planはアーキテクチャ分析など広範な読み込みに向いている
Bashはテスト実行やビルドの分離に使う

1つのプロンプト、3つの並列エージェント、オンボーディング時間が半分に

独立したタスクは並列実行できる。「認証システム、データベーススキーマ、APIルートをそれぞれ別に調査して」という一つのプロンプトで、3つのExploreエージェントが同時に立ち上がる。

このパターンを教えた新しいチームメンバーは、コードベースの把握にかかる時間が半分になった。ルールは一つだけ——同じファイルを変更するエージェントを並列で走らせてはいけない。競合が発生する。

独立タスク → 並列、依存タスク → 直列
同じファイルへの同時編集は必ず競合する
プロンプトに「並列で」と加えるだけでClaudeが自動で分割する
3つの同時要約がメインに占めるのはおよそ600トークン

Ctrl+Bでテスト実行中に次の機能を始める

Ctrl+Bを押すと、現在のエージェントがバックグラウンドに移る。全テストスイートを走らせながら、すぐに次の機能の実装を始められる。これがなければ、プログレスバーを眺めて待つだけだ。

バックグラウンドエージェントは質問もできないし、MCPツールも使えない。ファイルの読み書きのみ——だがテスト実行やコードレビューにはそれで十分だ。

Ctrl+Bで現在のエージェントをバックグラウンドへ
後で「テストの結果はどうだった？」と確認するだけ
バックグラウンドエージェント：MCPツールなし、ファイル読み書きのみ
実装を続けながらバックグラウンドでコードレビューを走らせられる

カスタムエージェントファイル1つで5つのツールに対応

.claude/agents/reviewer.mdというファイルを一つ作る。YAMLのフロントマターにname、description、modelを書けば、Claude Codeが自動で検出して、条件に合うタスクをそのエージェントに回してくれる。

このファイル形式はagentskills.ioの標準に準拠しており、一度作ったエージェントはCursor、Copilot、Codex、Gemini CLIでも変更なしに動く。

npx ai-agent-skills install code-reviewを実行すれば、事前に検証済みの47のエージェントを即座にダウンロードできる。

.claude/agents/にmarkdownファイルを置くだけで自動認識
安価なレビューにはmodel: haiku、セキュリティ監査やエラーハンドリングの確認にはopusやsonnetを設定
Claude Code、Cursor、Copilot、Codexに対応

本当の問題はAIが賢くなくなることじゃない

AIの能力が落ちているわけではない。メインセッションのコンテキストが増えすぎて、全体を見通せなくなっているだけだ。サブエージェントはAIをもっと使うための仕組みではない——AIが考えるための空間を守るための仕組みだ。

ニュースレターに登録

最新のプロジェクト、記事、AIとWeb開発の実験に関する情報をお届けします。