AI 编程与软件工程

氛围编程、自主编程代理和 AI 驱动的软件工程。

12 篇

2026年3月12日

Claude Code 29个工具 vs Codex 7个工具：设计理念截然相反

我深入研究了两款工具的SDK类型定义和系统提示词。29与7的差距并非功能数量的问题，而是对同一问题的两种根本性不同的回答：AI编程智能体应该如何与你的系统交互？

2026年3月12日

有人对一个完全由 LLM 生成的 SQLite Rust 重写版本做了性能基准测试。能跑通、能编译、看起来没问题的代码，和真正正确的代码之间，差距竟然达到五个数量级。

2026年3月5日

我逆向分析了 Codex 与 Claude Code 处理上下文溢出的差异，答案涉及 AES 加密、会话交接模式以及 KV 缓存技巧，整个架构远比想象中复杂。

2026年3月3日

Anthropic的Claude Code团队花了一年时间增删和重新设计工具，发现减少工具反而让AI表现更好。以下是他们总结的四条原则。

2026年2月26日

被人指出公开发布的成果太少后失眠了，凌晨3点开始写free-router。它能实时找到免费AI模型，一键连接到你的编程工具。

2026年2月25日

当代理每天推送 3000 次提交，人工根本审查不过来。这里介绍如何构建一套由机器验证的流水线，捕捉人类遗漏的问题。

2026年2月25日

最新基准测试数据表明，AGENTS.md 和 CLAUDE.md 这类上下文文件实际上会拖累编程智能体的表现。有时候，懒惰才是最好的工程决策。

2026年2月25日

三家公司几乎同时更新了编码代理。方向高度重合。真正的竞争焦点不是模型，而是吸收开发者工作流的速度。

2026年2月17日

Thomas Wolf提出的AI时代软件架构根本性变革。从依赖库时代的终结到AI专用语言的出现，赞同与质疑并存的深度解读。

2026年2月12日

OpenAI Codex 团队仅用 AI Agent 构建了百万行代码库，本文解析他们总结的 Harness 工程五大核心原则。

2026年2月8日

当市场对GPU产能过剩发出警报时,OpenAI却宣称需要更多算力。AI行业的飞轮效应正在形成,但真正的瓶颈可能并不在算力本身。

2026年2月8日

2026年，创业的语法正在改写。比起自己写代码的能力，知道让AI做什么、怎么做的眼光才是新的竞争力。