目录
1 分钟阅读

AI Wrapper 时代已经结束。Claude Agent Wrapper 时代正式开启。

Anthropic 的 Tariq Shihipar 揭示了构建生产级 Agent 的核心要素 - 从 Bash 优先的工具设计到基于文件系统的上下文工程。

我拆解了 Anthropic Claude Code 负责人 Tariq Shihipar 主导的一场 90 分钟 Workshop。

自 Manus 以来,整个行业对 Agent 的兴趣呈爆发式增长 - 但真正能在生产环境中跑起来的 Agent 到底怎么造,依然模糊得让人抓狂。这场 Workshop 是 Anthropic 对这个问题的正面回答。

抛开那些只是套了层 LLM API 外壳的服务,在设计 Agent 原生应用时,到底需要做出哪些本质改变?以下是四个核心要点。

Bash 是最强大的工具

你不需要几十个自定义工具。

  • Linux 上已有的软件 - ffmpeg、jq、curl 等等 - 通过 Bash 命令组合起来就能搞定绝大多数任务。
  • Agent 可以自己通过阅读 man page 和 --help 输出来学会使用工具。
  • 你不需要把每个工具的规格说明都塞进提示词里,也就意味着更少的上下文窗口浪费。

这背后的意义很深远:与其为每一项功能都去搭专门的集成,不如直接给 Agent 一个 shell,让它自己编排已有的软件。整个 CLI 工具生态都变成了 Agent 的工具箱 - 而且这些工具完全不需要提前注册。

Agent 循环的核心是验证

收集上下文 → 执行动作 → 验证结果。

  • 判断要不要用 Agent 的标准很简单:你能不能验证它的输出?
  • 代码很容易验证 - 编译器和 Linter 天然就在那里。对于研究类任务,你需要单独设计验证逻辑 - 比如要求附带引用来源。
  • 不要只依赖模型的智力。在循环中放入确定性工具 - 文件存在性检查、语法校验、类型检查 - 用它们来防止幻觉。

这是大多数团队忽略的关键洞察。他们把精力放在让 Agent 更聪明上,但真正该做的是让 Agent 更可验证。一个平庸的模型配上强大的验证循环,会完胜一个天才模型配上零验证。

非开发工作也通过代码生成来解决

即使是查天气、分析邮件这种简单任务,用代码处理也比用纯文本回复更高效。

  • 方法是:让 Agent 即时编写脚本,串联多个 API 并处理数据。
  • Claude Code 有相当大比例的用户其实并非开发者 - 来自市场、财务、运营等岗位。
  • 把数据分析和重复性任务当作”一次性代码”来处理 - 写完就跑、跑完就扔 - 正在成为标准工作流。

这重新定义了 Agent 时代”写代码”的含义。Agent 不需要预先集成你的邮件服务商。它直接写一个脚本去调 API、过滤数据、返回结果 - 全部在运行时生成。

上下文工程活在文件系统里

除了提示词工程,你还需要设计 Agent 所处的工作环境。

  • 给 Agent 增加新能力,靠的不是复杂的微调,而是给它一个文件夹,里面放好写得清楚的 Markdown 文件和脚本。
  • Tariq 把这种理念称为 “file system pilled”(文件系统信仰)。
  • Agent 是有状态的。Agent 架构的核心是一个沙箱环境 - 一个容器 - 在其中 Agent 拥有文件系统访问权限,可以执行 Bash 命令。

可以这样理解:文件系统同时充当了 Agent 的长期记忆、参考资料库和工作空间。项目根目录下的 CLAUDE.md 不只是文档 - 它是 Agent 的入职指南。scripts/ 目录不只是工具集 - 它是 Agent 的装备库。

范式转移

就像 Web 开发从 jQuery 演进到 React - 从命令式 DOM 操作转向组件化架构 - Agent 开发也正在从裸调提示词走向结构化框架。

问题不再是”我该问什么”,而是”我该给什么权限和环境”。

真正理解这个区分的团队 - 明白 Agent 的表现取决于围绕它的系统而非模型本身 - 将会打造下一代软件。

基于 Tariq Shihipar 在 Anthropic 的 Workshop 内容。

订阅通讯

获取关于我最新项目、文章以及 AI 和 Web 开发实验的更新。