2026年2月8日 1 分钟阅读

AI Wrapper 时代已经结束。Claude Agent Wrapper 时代正式开启。

Anthropic 的 Tariq Shihipar 揭示了构建生产级 Agent 的核心要素 - 从 Bash 优先的工具设计到基于文件系统的上下文工程。

我拆解了 Anthropic Claude Code 负责人 Tariq Shihipar 主导的一场 90 分钟 Workshop。

自 Manus 以来，整个行业对 Agent 的兴趣呈爆发式增长 - 但真正能在生产环境中跑起来的 Agent 到底怎么造，依然模糊得让人抓狂。这场 Workshop 是 Anthropic 对这个问题的正面回答。

抛开那些只是套了层 LLM API 外壳的服务，在设计 Agent 原生应用时，到底需要做出哪些本质改变？以下是四个核心要点。

Bash 是最强大的工具

你不需要几十个自定义工具。

这背后的意义很深远：与其为每一项功能都去搭专门的集成，不如直接给 Agent 一个 shell，让它自己编排已有的软件。整个 CLI 工具生态都变成了 Agent 的工具箱 - 而且这些工具完全不需要提前注册。

收集上下文 → 执行动作 → 验证结果。

这是大多数团队忽略的关键洞察。他们把精力放在让 Agent 更聪明上，但真正该做的是让 Agent 更可验证。一个平庸的模型配上强大的验证循环，会完胜一个天才模型配上零验证。

即使是查天气、分析邮件这种简单任务，用代码处理也比用纯文本回复更高效。

这重新定义了 Agent 时代”写代码”的含义。Agent 不需要预先集成你的邮件服务商。它直接写一个脚本去调 API、过滤数据、返回结果 - 全部在运行时生成。

除了提示词工程，你还需要设计 Agent 所处的工作环境。

可以这样理解：文件系统同时充当了 Agent 的长期记忆、参考资料库和工作空间。项目根目录下的 CLAUDE.md 不只是文档 - 它是 Agent 的入职指南。scripts/ 目录不只是工具集 - 它是 Agent 的装备库。

就像 Web 开发从 jQuery 演进到 React - 从命令式 DOM 操作转向组件化架构 - Agent 开发也正在从裸调提示词走向结构化框架。

问题不再是”我该问什么”，而是”我该给什么权限和环境”。

真正理解这个区分的团队 - 明白 Agent 的表现取决于围绕它的系统而非模型本身 - 将会打造下一代软件。

基于 Tariq Shihipar 在 Anthropic 的 Workshop 内容。

获取关于我最新项目、文章以及 AI 和 Web 开发实验的更新。