Claude Code 29 個工具 vs Codex 7 個工具:設計哲學完全相反
我深入研究了兩款工具的 SDK 型別定義和系統提示詞。29 對 7 的落差不在於功能數量,而是兩個截然不同的答案,回應同一個問題:AI 程式開發代理人該如何與你的系統互動?
氛圍程式設計、自主程式設計代理和 AI 驅動的軟體工程。
12 posts
我深入研究了兩款工具的 SDK 型別定義和系統提示詞。29 對 7 的落差不在於功能數量,而是兩個截然不同的答案,回應同一個問題:AI 程式開發代理人該如何與你的系統互動?
有人對 LLM 用 Rust 重新實作的 SQLite 做了效能測試。看起來正確和真正正確之間的差距,竟然達到五個數量級。
我逆向工程了 Codex 與 Claude Code 處理 context 溢出的方式差異。Codex 透過伺服器端 AES 加密摘要與 session 交接模式保留關鍵資訊,再搭配 KV cache 優化大幅降低延遲與成本。每個設計決策都直接影響長時間開發 session 的品質與可靠性。
最新的基準測試數據顯示,AGENTS.md 和 CLAUDE.md 這類 context 檔案其實會讓 coding agent 的表現變差。有時候,懶,就是最好的工程決策。
OpenAI Codex 團隊僅用 AI Agent 建構了百萬行程式碼庫,本文解析他們歸納的 Harness 工程五大核心原則。
當市場對 GPU 產能過剩拉警報時,OpenAI 卻透過官方管道宣告:我們需要更多算力。這場算力軍備競賽的真正瓶頸,其實藏在意想不到的地方。