AI Wrapperの時代は終わった。Claude Agent Wrapperの時代が始まる。
AnthropicのTariq Shihiparが本番環境で動くエージェント構築の核心を解説 - Bashファーストなツール設計からファイルシステム駆動のコンテキストエンジニアリングまで。
AnthropicでClaude Codeを率いるTariq Shihiparによる90分のワークショップを分析した。
Manus以降、エージェントへの関心は爆発的に高まっている。しかし、本番環境で実際に動くエージェントをどう構築するかについては、いまだに曖昧なままだ。このワークショップは、その問いに対するAnthropicの回答だった。
LLM APIを単にラップしたサービスを超えて、エージェントネイティブなアプリケーションを設計するとき、何を変えなければならないのか。ここに4つの核心的なポイントがある。
Bashは最強のツールである
カスタムツールを何十個も用意する必要はない。
- Linux上に既存のソフトウェア - ffmpeg、jq、curlなど - がBashコマンドで組み合わせれば、大半のタスクをこなせる。
- エージェントはmanページや
--helpの出力を読むことで、ツールの使い方を自ら学習する。 - すべてのツール仕様をプロンプトに詰め込む必要がなくなり、コンテキストウィンドウの無駄遣いが減る。
この含意は大きい。あらゆる機能に専用のインテグレーションを構築する代わりに、エージェントにシェルを渡し、既存のソフトウェアを自由に組み合わせさせればいい。CLIツールの世界がそのままエージェントのツールボックスになる - 事前に登録する必要は一切ない。
エージェントループの核心は検証にある
コンテキスト収集 → アクション実行 → 結果の検証。
- エージェントを使うべきかどうかの判断基準はシンプルだ。アウトプットを検証できるかどうか。
- コードはコンパイラやリンターで容易に検証できる。リサーチ系のタスクでは、ソースの引用を義務づけるなど、検証ロジックを別途設計する必要がある。
- モデルの知性だけに頼ってはいけない。ファイルの存在チェック、構文検証、型チェックなどの決定論的なツールをループ内に配置し、ハルシネーションを防ぐ。
これは多くのチームが見落としているポイントだ。エージェントを「賢くする」ことに注力しがちだが、本来は「検証可能にする」ことに注力すべきなのだ。強力な検証ループを持つ平凡なモデルは、検証ループを持たない優秀なモデルに勝る。
非開発業務もコード生成で解決する
天気の確認やメールの分析といった単純なタスクでさえ、テキスト応答よりもコードで処理するほうが優れている。
- アプローチはこうだ。エージェントにその場でスクリプトを書かせ、複数のAPIを接続してデータを処理させる。
- Claude Codeユーザーのかなりの割合が、実は非開発職 - マーケティング、財務、オペレーション - だ。
- データ分析や繰り返しタスクを使い捨てコード - 一度書いて、一度実行して、捨てるスクリプト - として扱うのが標準的なワークフローになりつつある。
これはエージェント時代における「コーディング」の意味を再定義する。エージェントはメールプロバイダーとの事前統合を必要としない。APIを呼び出し、データをフィルタリングし、結果を返すスクリプトを実行時に生成するのだ。
コンテキストエンジニアリングはファイルシステムに宿る
プロンプトエンジニアリングを超えて、エージェントが動作する環境そのものを設計する必要がある。
- エージェントに新しい能力を与えるのに、複雑なファインチューニングは要らない。よく書かれたMarkdownファイルとスクリプトが入ったフォルダを渡すだけでいい。
- Tariqはこれを「ファイルシステム至上主義(file system pilled)」と表現した。
- エージェントには状態がある。エージェントアーキテクチャの核心は、サンドボックス化された環境 - コンテナ - であり、そこでエージェントはファイルシステムへのアクセスとBashコマンドの実行権限を持つ。
こう考えるとわかりやすい。ファイルシステムはエージェントの長期記憶であり、リファレンスライブラリであり、作業場でもある。プロジェクトルートにあるCLAUDE.mdは単なるドキュメントではない - エージェントのオンボーディングガイドだ。scripts/ディレクトリは単なるユーティリティ集ではない - エージェントのツールキットそのものだ。
パラダイムシフト
Web開発がjQueryからReactへ進化したように - 命令的なDOM操作からコンポーネントベースのアーキテクチャへ - エージェント開発も、生のプロンプト呼び出しから構造化されたフレームワークへと移行しつつある。
問いはもはや「何を聞くべきか?」ではない。「どんな権限と環境を与えるべきか?」だ。
この違いを理解しているチーム - エージェントのパフォーマンスはモデルよりも、その周囲のシステムで決まるという事実を理解しているチーム - が、次世代のソフトウェアを作る。
Tariq Shihipar(Anthropic)のワークショップに基づく。
ニュースレターに登録
最新のプロジェクト、記事、AIとWeb開発の実験に関する情報をお届けします。