2026年2月12日 1 分钟阅读 2026

OpenAI 纯靠 Agent 写出百万行代码的秘密：Harness 工程五大原则

OpenAI Codex 团队仅用 AI Agent 构建了百万行代码库，本文解析他们总结的 Harness 工程五大核心原则。

最近”Harness”这个词越来越频繁地出现。OpenAI 发布的一篇博客终于为这个概念下了清晰的定义。在 Agent 时代，工程师到底该做什么？我们来梳理一下。

Harness（线束/工具壳）是让 AI Agent 能够影响现实世界的工具外壳。如果推理模型是大脑，那 Harness 就是手脚。读取文件、修改代码、运行测试、部署上线, , 所有操作都发生在 Harness 内部。

OpenAI 内部团队从 2025 年 8 月底一个空仓库起步，纯靠 Codex Agent 构建了一个百万行的新产品。条件是：不允许人类手写代码。据报告，耗时仅为手工开发的十分之一。他们在此过程中总结出以下五条原则。

Agent 看不到的知识等于不存在

对 Codex 而言，运行时无法访问的信息就等于不存在。Google Docs 里的需求文档、Slack 中达成的架构共识、某个人脑子里的隐性知识, , 全都看不见。这和三个月后入职的新人面临的处境完全一样。

因此团队将所有决策推入仓库中的 Markdown 文档、Schema 和执行计划（ExecPlan）。

早期 Agent 的速度低于预期。原因不在模型能力，而在环境准备不足。每次失败时，团队都会问：“缺少了什么能力？怎样才能让 Agent 可读取、可验证？”

仅靠文档无法维持 Agent 生成代码库的一致性。于是团队选择了只机械化强制不变规则、而非事无巨细地指导实现。他们要求在数据边界必须做解析，但把库的选择权留给了 Agent。架构固定为分层领域结构，依赖方向由 Linter 验证。

团队将 Chrome DevTools Protocol 接入 Agent 运行时，为 Codex 提供 DOM 快照、截图和导航能力。结构是：对比任务前后的快照、观察运行时事件、然后在循环中不断修复直到一切正常。

可观测性工具也以相同方式接入。每个 git worktree 会启动一个临时观测栈，工作结束后自动销毁。

上下文管理决定了 Agent 的效能。一开始团队尝试把所有内容塞进一个巨大的 AGENTS.md，结果失败了。matklad 在 2021 年写的 ARCHITECTURE.md 理念在这里大放异彩。原则是：简短鸟瞰项目整体结构，只收录不常变化的内容。对 Agent 同样适用。

即便是 Codex 团队，也有尚未解答的问题。纯靠 Agent 构建的系统能否在数年内保持架构一致性，没有人知道。模型持续进化后，这套体系本身会如何变化，也是未知数。

有一点是明确的：写好代码的时代正在落幕，设计好环境的时代已经开始。

获取最新 AI 洞见。