AI 編程與軟件工程

氛圍編程、自主編程代理同 AI 驅動嘅軟件工程。

12 篇

2026年3月12日

Claude Code 29 個工具 vs Codex 7 個工具：設計哲學南轅北轍

我深挖了兩款工具的 SDK 類型定義同系統提示。29 vs 7 的差距唔係功能多少的問題，而係兩個截然不同的答案，回應同一條問題：AI 編程 agent 應該點樣同你的系統互動？

2026年3月12日

有人對 LLM 用 Rust 重寫的 SQLite 進行基準測試。結果揭示了「看起來正確的程式碼」與「真正正確的程式碼」之間，可以相差五個數量級。

2026年3月5日

我逆向工程咗 Codex 嘅 context overflow 處理方式。背後涉及 AES 加密、session 交接模式，同埋 KV cache 優化。

2026年3月3日

Anthropic嘅Claude Code團隊用咗一年時間增刪同重新設計工具，發現減少工具反而令AI表現更好。以下係四條實戰原則。

2026年2月26日

畀人話公開發布嘅成果太少之後瞓唔著，凌晨3點開始寫free-router。佢可以即時搵到免費AI模型，一鍵連接到你嘅編程工具。

2026年2月25日

當 agent 每日推送 3,000 個 commit，人類根本審查唔晒。呢篇文章教你建立一條由機器自動驗證的流水線，捕捉人類看漏的問題。

2026年2月25日

最新 benchmark 數據顯示，AGENTS.md 同 CLAUDE.md 呢啲 context 檔案其實會拖低 coding agent 嘅表現。有時候，懶惰先係最正確嘅工程決策。

2026年2月25日

三間公司幾乎同時更新咗編碼代理。方向高度重合。真正嘅競爭焦點唔係模型，而係吸收開發者工作流嘅速度。

2026年2月17日

Thomas Wolf提出嘅AI時代軟件架構根本性變革。由依賴套件時代嘅終結到AI專用語言嘅出現，贊同同質疑並存嘅深度解讀。

2026年2月12日

OpenAI Codex 團隊淨用 AI Agent 就建構咗百萬行代碼庫，呢篇文章解析佢哋總結嘅 Harness 工程五大核心原則。

2026年2月8日

當市場憂慮 GPU 產能過剩,OpenAI 反而高調表示需要更多算力。真正樽頸唔係運算能力,而係用戶體驗 - 點樣令人用得切實際需求。

2026年2月8日

2026年，創業嘅語法正喺度改寫緊。比起自己寫code嘅能力，知道點樣指揮AI先係新嘅競爭力。