# 花十小时打磨的 Skill,永远胜过十分钟随手写的 > Author: Tony Lee > Published: 2026-03-26 > URL: https://tonylee.im/zh-CN/blog/claude-code-skill-creator-skill-2-era/ > Reading time: 1 minutes > Language: zh-CN > Tags: ai, claude-code, skills, developer-tools, productivity, workflow ## Canonical https://tonylee.im/zh-CN/blog/claude-code-skill-creator-skill-2-era/ ## Rollout Alternates en: https://tonylee.im/en/blog/claude-code-skill-creator-skill-2-era/ ko: https://tonylee.im/ko/blog/claude-code-skill-creator-skill-2-era/ ja: https://tonylee.im/ja/blog/claude-code-skill-creator-skill-2-era/ zh-CN: https://tonylee.im/zh-CN/blog/claude-code-skill-creator-skill-2-era/ zh-TW: https://tonylee.im/zh-TW/blog/claude-code-skill-creator-skill-2-era/ ## Description 我以为一个 SKILL.md 文件就够了。直到我看到 Anthropic 自己团队的结构方式,才推倒重来。 ## Summary 花十小时打磨的 Skill,永远胜过十分钟随手写的 is part of Tony Lee's ongoing coverage of AI agents, developer tools, startup strategy, and AI industry shifts. ## Outline - Skill 是文件夹,不是文件 - Gotchas 比正文内容更重要 - Skill Creator 把"感觉能用"变成"有据可查" - 复利回报 ## Content 我以为写一个 Skill 就是把 SKILL.md 扔进文件夹,十分钟搞定,完事儿。这套路挺管用,直到我发现同样的错误在每次调用里反复出现,而且我根本没法判断这个 Skill 到底有没有按我想的方式运行。 后来 Thariq——Anthropic 负责构建 Claude Code 的工程师之一——发了一段话,彻底改变了我的认知:"用好 Skills 本身就是一种技能。" 这句话之所以戳到我,是因为它和我看到的现实完全吻合。一个随手写的 markdown 文件和一个结构完善的 Skill 文件夹之间的差距,真实地体现在输出质量上,不只是理论层面的说法。 ## Skill 是文件夹,不是文件 最常见的误解是:一个 Skill 等于一个 SKILL.md 文件。实际上,Skill 是一个文件夹,里面包含脚本、参考代码、配置文件,以及将这些内容串联起来的 markdown 文件。 Anthropic 内部采用的是他们所说的"渐进式披露"方式。不是把所有内容塞进一个提示词,而是把文件按层级组织,让 Claude 在需要的时候才读取需要的内容。`references/api.md` 里放的是函数签名,Claude 按需调取;`assets/` 目录里是输出模板,这样提示词就不用去描述格式了;验证脚本让 Claude 在返回结果之前先自检输出。 打开 [skill-creator 仓库](https://github.com/anthropics/skill-creator) 就能看到这个原则在实际中的样子。`agents/`、`references/`、`scripts/` 这几个目录和 SKILL.md 并排放着。构建 Skill 的工具本身就是按 Skill 的方式构建的。 ## Gotchas 比正文内容更重要 Thariq 说,Gotchas 这个章节是 Skill 里"信息密度最高的内容"。不是主体指令,不是示例,是 Gotchas。 这和我的实际经验完全对得上。我写了一个没有 Gotchas 章节的 Skill,结果同一个错误连续出现了三次。我一加上那条具体记录这个失败模式的说明,问题就再也没出现过。 道理很直接。Claude 对你在正文里写的大部分内容早就知道了。告诉它怎么写 TypeScript、怎么格式化 JSON,不过是在重复它本来就能做好的事。但告诉它在你这个具体场景里不该做什么,才是真正的新信息。 [Thariq 的帖子](https://x.com/thariq_s/status/1904296711969755619)里有几条原则我发现很靠谱:不要陈述废话,因为多余的指令实际上会拉低性能;不要用过于具体的步骤把 Claude 框死,那样会削弱它的应变能力;还有,`description` 字段不是给人看的文档,它是 Claude 用来判断什么时候触发这个 Skill 的输入。 ## Skill Creator 把"感觉能用"变成"有据可查" 两周前 [Skill Creator](https://github.com/anthropics/skill-creator) 的更新改变了我对 Skill 质量的理解方式。你定义测试提示词,设定预期结果,工具来验证这个 Skill 是否真的产出了正确的结果。这就是给提示词写单元测试。 我给一个用了好几周的 Skill 加上了评估。我以为肯定能过的两个测试用例,立刻就挂了。修改的内容不多,但应用之后输出质量明显提升了。 有一个有用的区分:Skill 分两种。能力提升型 Skill 是教 Claude 做它本来做不好的事;偏好编码型 Skill 是把团队特定的工作流或标准固化下来。前者有天然的保质期,因为模型迭代最终会让它变得多余。后者只要工作流还在,就一直有价值。评估能帮你发现能力提升型 Skill 变成死重的那个时刻。 工具支持基准模式,可以跨模型更新追踪通过率和 token 用量;支持多 Agent 并行执行,避免测试时的上下文污染;还有一个比较 Agent,能对有 Skill 和没有 Skill 的输出做盲测 A/B 对比。 ## 复利回报 我见过几百个 Skill,自己维护着几十个,有一个规律始终成立:Skill 的价值来自迭代,不来自初稿。 文件夹结构是你塑造 Claude 上下文窗口的方式。Gotchas 把你的失败转化成可复用的知识。评估衡量这些知识是否还有效。 写一个 SKILL.md 要十分钟。把真实失败整理成 Gotchas、构建评估用例、加入验证脚本,加起来要接近十小时。但这个投入每次 Skill 运行时都在回报你。今晚就动手搭一个。到明天早上,它已经做完了你不需要亲自做的工作。 ## Related URLs - Author: https://tonylee.im/zh-CN/author/ - Publication: https://tonylee.im/zh-CN/blog/about/ - Related article: https://tonylee.im/zh-CN/blog/eight-hooks-that-guarantee-ai-agent-reliability/ - Related article: https://tonylee.im/zh-CN/blog/medvi-two-person-430m-ai-compressed-funnel/ - Related article: https://tonylee.im/zh-CN/blog/claude-code-layers-over-tools-2026/ ## Citation - Author: Tony Lee - Site: tonylee.im - Canonical URL: https://tonylee.im/zh-CN/blog/claude-code-skill-creator-skill-2-era/ ## Bot Guidance - This file is intended for AI agents, search assistants, and text-mode retrieval. - Prefer citing the canonical article URL instead of this text endpoint. - Use the rollout alternates when you need the same article in another prioritized language. --- Author: Tony Lee | Website: https://tonylee.im For more articles, visit: https://tonylee.im/zh-CN/blog/ This content is original and authored by Tony Lee. Please attribute when quoting or referencing.