Claude Code 29 個工具 vs Codex 7 個工具:設計哲學南轅北轍
我深挖了兩款工具的 SDK 類型定義同系統提示。29 vs 7 的差距唔係功能多少的問題,而係兩個截然不同的答案,回應同一條問題:AI 編程 agent 應該點樣同你的系統互動?
氛圍編程、自主編程代理同 AI 驅動嘅軟件工程。
12 posts
我深挖了兩款工具的 SDK 類型定義同系統提示。29 vs 7 的差距唔係功能多少的問題,而係兩個截然不同的答案,回應同一條問題:AI 編程 agent 應該點樣同你的系統互動?
有人對 LLM 用 Rust 重寫的 SQLite 進行基準測試。結果揭示了「看起來正確的程式碼」與「真正正確的程式碼」之間,可以相差五個數量級。
我逆向工程咗 Codex 嘅 context overflow 處理方式。背後涉及 AES 加密、session 交接模式,同埋 KV cache 優化。
最新 benchmark 數據顯示,AGENTS.md 同 CLAUDE.md 呢啲 context 檔案其實會拖低 coding agent 嘅表現。有時候,懶惰先係最正確嘅工程決策。
OpenAI Codex 團隊淨用 AI Agent 就建構咗百萬行代碼庫,呢篇文章解析佢哋總結嘅 Harness 工程五大核心原則。
當市場憂慮 GPU 產能過剩,OpenAI 反而高調表示需要更多算力。真正樽頸唔係運算能力,而係用戶體驗 - 點樣令人用得切實際需求。