# OpenAI 淨靠 Agent 寫出百萬行代碼嘅秘密:Harness 工程五大原則 > Author: Tony Lee > Published: 2026-02-12 > URL: https://tonylee.im/zh-HK/blog/openai-harness-engineering-five-principles-codex/ > Reading time: 1 minutes > Language: zh-HK > Tags: ai, ai-agents, openai, codex, harness-engineering, software-engineering ## Canonical https://tonylee.im/zh-HK/blog/openai-harness-engineering-five-principles-codex/ ## Rollout Alternates en: https://tonylee.im/en/blog/openai-harness-engineering-five-principles-codex/ ko: https://tonylee.im/ko/blog/openai-harness-engineering-five-principles-codex/ ja: https://tonylee.im/ja/blog/openai-harness-engineering-five-principles-codex/ zh-CN: https://tonylee.im/zh-CN/blog/openai-harness-engineering-five-principles-codex/ zh-TW: https://tonylee.im/zh-TW/blog/openai-harness-engineering-five-principles-codex/ ## Description OpenAI Codex 團隊淨用 AI Agent 就建構咗百萬行代碼庫,呢篇文章解析佢哋總結嘅 Harness 工程五大核心原則。 ## Summary OpenAI 淨靠 Agent 寫出百萬行代碼嘅秘密:Harness 工程五大原則 is part of Tony Lee's ongoing coverage of AI agents, developer tools, startup strategy, and AI industry shifts. ## Outline - Agent 睇唔到嘅知識等於唔存在 - 唔好講「再努力啲」,要問「缺咗咩能力」 - 機械化強制而唔係文件嚟保證代碼一致性 - 畀 Agent 裝上眼睛,佢可以獨自做嘢 6 個鐘 - 畀地圖,唔好畀千頁手冊 - 仲未解答嘅問題 ## Content 最近「Harness」呢個詞越嚟越頻繁咁出現。OpenAI 發布嘅一篇博客文章終於為呢個概念落咗清楚嘅定義。喺 Agent 時代,工程師到底要做啲咩?我哋嚟整理一下。 Harness(工具殼)係令 AI Agent 能夠影響現實世界嘅工具外殼。如果推理模型係大腦,咁 Harness 就係手腳。讀取檔案、修改代碼、跑測試、部署上線, , 所有操作都係喺 Harness 入面發生。 OpenAI 內部團隊由 2025 年 8 月尾一個空嘅儲存庫起步,淨靠 Codex Agent 就建構咗一個百萬行嘅新產品。條件係:唔准人類手寫代碼。據報告,耗時只係手工開發嘅十分之一。佢哋喺呢個過程中歸納出以下五條原則。 ## Agent 睇唔到嘅知識等於唔存在 對 Codex 嚟講,運行期間存取唔到嘅資訊就等於唔存在。Google Docs 入面嘅需求文件、Slack 度達成嘅架構共識、某個人腦入面嘅隱性知識, , 全部都睇唔到。呢個同三個月後先加入嘅新人面對嘅處境一模一樣。 所以團隊將所有決策推入儲存庫入面嘅 Markdown 文件、Schema 同執行計劃(ExecPlan)。 - **ExecPlan** 係喺 PLANS.md 入面定義嘅自包含設計文件 - 通過標準:新手讀完之後能夠獨立完成實作 - 有 Codex 單次 Prompt 連續工作超過 7 個鐘嘅案例 - 將 matklad 嘅 ARCHITECTURE.md 概念擴展到 Agent 場景 ## 唔好講「再努力啲」,要問「缺咗咩能力」 早期 Agent 嘅速度低過預期。原因唔係模型能力,而係環境準備不足。每次失敗嘅時候,團隊都會問:「缺少咗咩能力?點樣先至可以令 Agent 讀取到、驗證到?」 - 用自研嘅並行 Helper 取代外部函式庫,同 OpenTelemetry 100% 整合 - 業界成日講嘅「悶技術」反而對 Agent 更加有利(API 穩定性高,訓練數據表示度高) ## 機械化強制而唔係文件嚟保證代碼一致性 淨靠文件冇辦法維持 Agent 生成代碼庫嘅一致性。於是團隊揀咗只機械化強制不變規則,而唔係逐樣逐樣咁指導實作。佢哋要求喺數據邊界必須做解析,但揀邊個函式庫就交畀 Agent 決定。架構固定做分層領域結構,依賴方向由 Linter 驗證。 - 每個業務領域固定層級:**Providers → Service → Runtime → UI** - Types、Config、Repo 作為底層共享嘅橫切關注點 - 自訂 Linter 同結構測試喺違規嗰陣即刻中斷建置 - Linter 本身都係由 Codex 撰寫 ## 畀 Agent 裝上眼睛,佢可以獨自做嘢 6 個鐘 團隊將 Chrome DevTools Protocol 接入 Agent 運行時期,為 Codex 提供 DOM 快照、截圖同導覽能力。結構係:對比任務前後嘅快照、觀察運行時期事件,然後喺迴圈入面不斷修復直到一切正常。 可觀測性工具都係用相同方式接入。每個 git worktree 會啟動一個臨時觀測堆疊,做完嘢之後自動銷毀。 - 透過 Victoria Logs(LogQL)同 Victoria Metrics(PromQL),Agent 可以直接查詢日誌同指標 - 「令服務啟動時間控制喺 800ms 以內」呢類 Prompt 變得可以執行 - 單次 Codex 運行專注喺一個任務超過 6 個鐘嘅情況被定期觀測到 ## 畀地圖,唔好畀千頁手冊 上下文管理決定咗 Agent 嘅效能。一開始團隊嘗試將所有內容塞入一個巨大嘅 AGENTS.md,結果失敗咗。matklad 喺 2021 年寫嘅 ARCHITECTURE.md 概念喺呢度大放異彩。原則係:簡短鳥瞰專案整體結構,只收錄唔常變化嘅內容。對 Agent 同樣適用。 - ARCHITECTURE.md 係代碼地圖,唔係代碼圖集 - 架構不變規則往往以「某樣嘢唔存在」嘅形式嚟表達 - 明確聲明邊界(boundary),就可以約束後續所有實作 ## 仲未解答嘅問題 就算係 Codex 團隊,都有仲未解答嘅問題。淨靠 Agent 建構嘅系統能唔能夠喺幾年內保持架構一致性,冇人知道。模型持續進化之後,呢套體系本身會點變化,都係未知數。 有一點係明確嘅:寫好代碼嘅時代正在落幕,設計好環境嘅時代已經開始。 ## Related URLs - Author: https://tonylee.im/en/author/ - Publication: https://tonylee.im/en/blog/about/ - Related article: https://tonylee.im/zh-HK/blog/eight-hooks-that-guarantee-ai-agent-reliability/ - Related article: https://tonylee.im/zh-HK/blog/medvi-two-person-430m-ai-compressed-funnel/ - Related article: https://tonylee.im/zh-HK/blog/claude-code-layers-over-tools-2026/ ## Citation - Author: Tony Lee - Site: tonylee.im - Canonical URL: https://tonylee.im/zh-HK/blog/openai-harness-engineering-five-principles-codex/ ## Bot Guidance - This file is intended for AI agents, search assistants, and text-mode retrieval. - Prefer citing the canonical article URL instead of this text endpoint. - Use the rollout alternates when you need the same article in another prioritized language. --- Author: Tony Lee | Website: https://tonylee.im For more articles, visit: https://tonylee.im/zh-HK/blog/ This content is original and authored by Tony Lee. Please attribute when quoting or referencing.