# 花十小時打磨的 Skill,每次都勝過十分鐘草稿 > Author: Tony Lee > Published: 2026-03-26 > URL: https://tonylee.im/zh-HK/blog/claude-code-skill-creator-skill-2-era/ > Reading time: 1 minutes > Language: zh-HK > Tags: ai, claude-code, skills, developer-tools, productivity, workflow ## Canonical https://tonylee.im/zh-HK/blog/claude-code-skill-creator-skill-2-era/ ## Rollout Alternates en: https://tonylee.im/en/blog/claude-code-skill-creator-skill-2-era/ ko: https://tonylee.im/ko/blog/claude-code-skill-creator-skill-2-era/ ja: https://tonylee.im/ja/blog/claude-code-skill-creator-skill-2-era/ zh-CN: https://tonylee.im/zh-CN/blog/claude-code-skill-creator-skill-2-era/ zh-TW: https://tonylee.im/zh-TW/blog/claude-code-skill-creator-skill-2-era/ ## Description 我以為一個 SKILL.md 檔案就夠了。直到看見 Anthropic 團隊的做法,才把一切重新建過。 ## Summary 花十小時打磨的 Skill,每次都勝過十分鐘草稿 is part of Tony Lee's ongoing coverage of AI agents, developer tools, startup strategy, and AI industry shifts. ## Outline - Skill 是一個資料夾,不是一個檔案 - Gotchas 比 prompt 內文更重要 - Skill Creator 讓「好像沒問題」變成「經過驗證」 - 複利回報 ## Content 我以為寫一個 Skill 就是把一個 SKILL.md 檔案丟進資料夾,然後完事。十分鐘搞掂。這個做法一開始看似沒問題,直到我發現每次呼叫都在重複同樣的錯誤,而且根本無從判斷這個 Skill 是否真的按我的意思運作。 後來,Anthropic 旗下負責構建 Claude Code 的工程師 Thariq 發了一篇文章,讓我重新理解這件事:「能否善用 Skills,本身就是一種能力。」 這句話之所以令我印象深刻,是因為它完全吻合我的親身經歷。一個隨手寫的 markdown 檔案,和一個結構嚴謹的 Skill 資料夾,兩者之間的差距,在實際輸出質素上一眼就看得出來,絕非紙上談兵。 ## Skill 是一個資料夾,不是一個檔案 最常見的誤解,是以為一個 Skill 等於一個 SKILL.md 檔案。實際上,一個 Skill 是一個資料夾,裏面包含腳本、參考代碼、設定檔,以及把一切串聯起來的 markdown 檔案。 Anthropic 內部採用的方法,他們稱之為「漸進式披露」。與其把所有東西塞進一個 prompt,他們把檔案分層排列,讓 Claude 在需要的時候才讀取相關內容。`references/api.md` 存放函數簽名,Claude 按需取用;`assets/` 目錄放置輸出模板,令 prompt 毋須再描述格式;驗證腳本讓 Claude 在回傳結果之前先自行測試輸出。 打開 [skill-creator repo](https://github.com/anthropics/skill-creator),就能看到這個原則的實際應用。`agents/`、`references/`、`scripts/` 等目錄與 SKILL.md 並排而存。構建 Skills 的工具本身,就是以這種方式構建的。 ## Gotchas 比 prompt 內文更重要 Thariq 稱 Gotchas 部分是 Skill 裏面「訊息密度最高的內容」。不是主要指示,不是範例,而是 Gotchas。 這與我的經驗完全吻合。我曾構建了一個沒有 Gotchas 部分的 Skill,結果同一個錯誤連續出現三次。當我加入一行記錄該錯誤模式的說明之後,問題便再沒有出現。 背後的邏輯很直接。prompt 內文裏大部分你想寫的東西,Claude 本來就已經知道。告訴它如何寫 TypeScript 或格式化 JSON,不過是在重述它本已掌握的事情。但告訴它在你的特定情境下不應該做甚麼,才是真正的新資訊。 [Thariq 的文章](https://x.com/thariq_s/status/1904296711969755619)裏有幾個原則,我發現非常實用:不要說廢話,因為冗餘指示實際上會降低表現;不要用過於細化的步驟把 Claude 框死,因為這會消除它自行調適的能力;另外要記住,`description` 欄位不是寫給人看的文件,而是 Claude 用來判斷何時觸發該 Skill 的輸入。 ## Skill Creator 讓「好像沒問題」變成「經過驗證」 兩週前更新的 [Skill Creator](https://github.com/anthropics/skill-creator) 徹底改變了我對 Skill 質素的看法。你定義測試 prompt,設定預期輸出,工具就會驗證這個 Skill 是否真的能產出正確結果。這就是針對 prompt 的單元測試。 我為一個已用了好幾個星期的 Skill 加入了評測。兩個我以為必定會通過的測試案例,馬上就失敗了。修改本身不算大,但應用之後,輸出質素明顯有所提升。 有一個實用的分類方式:把 Skills 分成兩種類型。「能力提升型 Skills」是教 Claude 它本身做不好的事情;「偏好編碼型 Skills」是將團隊的特定工作流程或標準固化下來。前者有自然的「到期日」,因為模型進步終究會令它變得多餘;後者只要工作流程存在,就一直有價值。評測能幫你捕捉到能力提升型 Skill 變成死重量的那個時刻。 工具支援基準測試模式,可以跨模型更新追蹤通過率和 token 用量;支援多 Agent 並行執行,避免測試期間的上下文污染;還有一個比較 Agent,能對有無 Skill 的輸出進行盲測 A/B 比對。 ## 複利回報 縱觀我見過的數百個 Skills,以及我自己維護的數十個,有一個規律始終成立:Skill 的價值來自持續迭代,而非初稿。 資料夾結構是你塑造 Claude 上下文視窗的方式。Gotchas 把你的失敗經驗轉化為可重用的知識。評測則驗證這些知識是否依然有效。 寫一個 SKILL.md 需要十分鐘。從真實失敗中提煉 Gotchas、建立評測案例、加入驗證腳本,加起來接近十個小時。但這份投入,每次 Skill 運行時都會回報給你。今晚就設定一個。到明早,它已經替你完成了你不需要親手做的工作。 ## Related URLs - Author: https://tonylee.im/en/author/ - Publication: https://tonylee.im/en/blog/about/ - Related article: https://tonylee.im/zh-HK/blog/eight-hooks-that-guarantee-ai-agent-reliability/ - Related article: https://tonylee.im/zh-HK/blog/medvi-two-person-430m-ai-compressed-funnel/ - Related article: https://tonylee.im/zh-HK/blog/claude-code-layers-over-tools-2026/ ## Citation - Author: Tony Lee - Site: tonylee.im - Canonical URL: https://tonylee.im/zh-HK/blog/claude-code-skill-creator-skill-2-era/ ## Bot Guidance - This file is intended for AI agents, search assistants, and text-mode retrieval. - Prefer citing the canonical article URL instead of this text endpoint. - Use the rollout alternates when you need the same article in another prioritized language. --- Author: Tony Lee | Website: https://tonylee.im For more articles, visit: https://tonylee.im/zh-HK/blog/ This content is original and authored by Tony Lee. Please attribute when quoting or referencing.