AI 代理與開發者工具
深入探討 AI 代理架構、上下文工程同開發者工作流程。
50 posts
點解你的 Codex Config 唔生效:.codex/ 資料夾問題
我改咗 config.toml、喺 AGENTS.md 寫咗規則,但全部都冇用。原來問題出喺資料夾結構本身,唔係 config 內容。
Codex搬入了Claude Code,這說明了一切
Anthropic發佈Computer Use嘅同一日,OpenAI將Codex做成Claude Code插件。我認為呢個係2026年最精明嘅讓步。
Claude Code 29 個工具 vs Codex 7 個工具:設計哲學南轅北轍
我深挖了兩款工具的 SDK 類型定義同系統提示。29 vs 7 的差距唔係功能多少的問題,而係兩個截然不同的答案,回應同一條問題:AI 編程 agent 應該點樣同你的系統互動?
Codex 點樣用加密摘要解決 Compaction 問題
我逆向工程咗 Codex 嘅 context overflow 處理方式。背後涉及 AES 加密、session 交接模式,同埋 KV cache 優化。
Shopify CEO親手整嘅搜尋引擎,1秒復活Claude Code 700個對話
Shopify CEO Tobias開發嘅QMD搜尋引擎駁上Claude Code之後,700個對話嘅記憶1秒內全部恢復。
Claude Code Sub-Agents 幫你節省主 Session 25 倍 Token
唔係 AI 愈用愈蠢。係你主 Session 已經超載。Sub-agents 令佢保持精簡,用多過一個鐘都唔出問題。
Claude Code 啱啱將所有人嘅每週限額歸零 — 究竟發生咗咩事
Claude Code v2.1.59–v2.1.61 中 Auto Memory 同上下文壓縮嘅競態條件破壞咗提示快取並污染咗工作階段。Anthropic 重置所有用戶每週限額作為補償。
Claude Code 用家必裝嘅兩個工具 — Agentation 同 Readout
Agentation 透過 CSS 選擇器畀 AI 代理像素級嘅視覺回饋。Readout 可以好似睇片咁回放 Claude Code 工作階段。兩個工具解決咗 AI 輔助前端開發最大嘅兩個痛點。
我翻查了 300 條 Agent 失敗記錄,問題從來都不是 Prompt。
一個開源的 context engineering skillset 剛突破 10,000 個 GitHub stars。實際用到自己的 agent stack 之後,我終於明白 agents 為何會失敗。
我懶得寫 CLAUDE.md——結果反而做對了
最新 benchmark 數據顯示,AGENTS.md 同 CLAUDE.md 呢啲 context 檔案其實會拖低 coding agent 嘅表現。有時候,懶惰先係最正確嘅工程決策。
將 Claude Code API 成本削減九成的 Cache 設計思路
生產環境的 cache 突然失效,那一個小時的 API 費用比過去三日加起來還要高。偏偏同一晚,Anthropic 工程師發文解釋了箇中原因。
任務成功率從 6.7% 升至 68.3%:讓性能相差 10 倍的是 harness,不是模型
LangChain 的 Terminal Bench 結果與 hashline 格式實驗所揭示的現象。同一模型排行榜名次逆轉的原因,在於提示詞、工具與中間件三個環節。
Web嘅頭號客戶正由人類轉向AI
由Cloudflare同Vercel嘅Markdown for Agents到Google嘅WebMCP, , 讀寫同步標準化,Agent-Native Web時代正式揭幕。
Anthropic 公開嘅 SKILL.md Body 寫法規則 5 條
收埋喺 Anthropic 官方文件入面嘅 SKILL.md body 寫法原則 5 條。由 description 同 body 嘅角色分工到驗證迴圈。
OpenAI點解要請OpenClaw開發者 - AI原生即時通訊時代嚟喇
OpenClaw創辦人Peter Steinberger加入OpenAI唔止係搶人才咁簡單。AI正在重新定義聊天App,深度分析呢場全球變革。
OpenAI 淨靠 Agent 寫出百萬行代碼嘅秘密:Harness 工程五大原則
OpenAI Codex 團隊淨用 AI Agent 就建構咗百萬行代碼庫,呢篇文章解析佢哋總結嘅 Harness 工程五大核心原則。
Claude Code Agent Teams:由設定到快捷鍵完整指南
Claude Code 多智能體團隊功能實用指南:啟用方法、鍵盤快捷鍵、終端機相容性、任務管理流程,以及目前已知嘅限制同注意事項。
AI Wrapper 時代已經結束。Claude Agent Wrapper 時代正式開啟。
Anthropic 的 Tariq Shihipar 揭示了構建生產級 Agent 的核心要素 - 由 Bash 優先的工具設計到檔案系統驅動的上下文工程。
Claude Code 係開發者嘅工具,Cowork 係所有人嘅工具
Anthropic 發佈 Cowork,一個可以自主讀取、編輯同建立本機檔案嘅代理。由 vibe coding 到 vibe working。
ChatGPT 係 Android,Claude 係 iOS
ChatGPT 同 Claude 爭奪 AI 應用商店之際,SaaS 市值蒸發 3000 億美元嘅真正原因,以及 2008 年流動戰爭帶嚟嘅啟示。
Claude Code 創始人實際上點樣用 Claude Code
Boris Cherny 嘅工作流喺 2 小時內攞到 5 千個讚。佢嘅設定比你諗嘅更簡單 - 並行工作階段、計劃模式、CLAUDE.md 同驗證循環。
令我徹底重新諗過嘅 Claude Code 設定指南
Anthropic 黑客松得獎者公開佢用咗10個月嘅 Claude Code 配置。由 Context Window 管理到 MCP Server 篩選、Skills/Hooks/子代理分工,全套設定即學即用。
Claude Code 嘅 Task 系統揭示咗 AI 原生工程師嘅核心能力
Claude Code 將 Todo 改名做 Task。睇落好細微嘅改動,但其實係為 AI Swarm 打造嘅全新系統嘅起點。
Meta 花 25 億美元收購嘅 Manus,核心技術已經開源
支撐 Manus 25 億美元估值嘅檔案記憶系統,而家以免費 Claude Code 技能發佈。每個 AI Agent 開發者都應該了解。
Manus 被 Meta 以 3 億美元收購後,聯同 LangChain 揭示 AI 代理開發核心原則
Manus 同 LangChain 聯合演講,分享咗喺生產環境開發 AI 代理嘅實戰經驗 - 由上下文腐化到評估指標嘅重新思考,全部都係血淚教訓。
點解 Claude Code 要棄用 Todos 同 Slash Commands
Anthropic 用兩日時間將 TodoWrite 換成 Tasks,又將 Slash Commands 換成 Skills。兩個改動其實指向同一個方向 - 為模型鬆綁。