Anthropic、OpenAI、Google 四項更新背後的隱藏共同點
三家公司幾乎同時更新了編碼代理。方向高度重合。真正的競爭焦點不是模型,而是吸收開發者工作流的速度。
上週,Anthropic、OpenAI 和 Google 三家公司幾乎同步推出了編碼代理的重大更新。單看每一則都像是功能公告,但並排放在一起看,會發現一個很清楚的訊號:大家搶的不只是模型能力,而是誰能更快把開發者的工作流直接吸收進產品裡。
以下逐一拆解這四項更新,最後再來談它們共同透露的方向。
Claude Code Remote Control:用手機掌控你的 AI 工程師
以前想在外出時繼續讓 Claude Code 跑任務,你大概要這樣做:
- 在遠端機器上開一個 tmux session
- 設定 Tailscale 讓手機連回家裡的開發機
- 打開 SSH,接上 tmux
- 然後希望網路夠穩
Anthropic 這次直接把這條流程砍掉,改成一個指令:/remote-control。
輸入之後,Claude Code 產生一組 QR code。手機掃一下,工作階段立刻轉移過去。就這樣。
幾個值得注意的細節:
- 筆電闔上自動重連:不用擔心裝置休眠斷線,重開就接回去
- 本地檔案系統不受影響:工作階段移到手機,但工具還是跑在你的機器上,MCP 伺服器同樣不受干擾
- Max 方案研究預覽:這次更新目前是 Max 方案用戶的研究功能預覽,還不是正式全量開放
從用戶體驗的角度來說,這個更新的本質是:Anthropic 發現很多人在用一堆土炮工具做遠端控制這件事,然後決定直接把這個使用場景吸收進來。
Cowork 企業擴展:外掛市集才是真正的護城河
Cowork 是 Anthropic 面向企業的協作功能,這次更新的重點不是某個特定功能,而是整個外掛生態系的基礎建設。
幾個關鍵更新:
內部專用外掛市集:管理員可以建立公司內部的外掛市集,並按照團隊或部門來部署不同的外掛組合。法務團隊和工程團隊能用到的外掛不一樣,這很合理。
新增 12 個連接器,包含 Docusign 和 FactSet。後者對金融產業的企業客戶來說是個很實際的整合。
10 種職能範本:幫助不同職能的用戶更快上手,不用每次都從空白狀態開始設定。
斜線指令結構化輸入表單:這個比較技術,但影響很大。以前斜線指令就是打文字,現在可以帶出有欄位的表單,讓輸入更結構化、更不容易出錯。
OpenTelemetry 使用量追蹤:企業客戶最在意的問題之一就是「這個 AI 工具到底用了多少、省了多少、又花了多少?」OpenTelemetry 整合讓這些數字可以進到既有的可觀測性系統裡。
與 Claude Agent SDK 使用相同外掛格式:這個細節很重要。代表你在 Cowork 裡建的外掛,和你自己用 SDK 寫的代理,是同一套介面。生態系不分裂。
說到底,外掛市集才是企業 AI 工具的真正護城河。不是因為功能,而是因為整合深度。當你的外掛格式成為標準,遷移成本就會急速上升。
Codex 子代理 + Responses API WebSocket:數字說話
OpenAI 的這兩個更新乍看是分開的,但放在一起效果很顯著。
Codex 子代理:Codex 現在正式支援子代理模式,也就是說一個主代理可以把子任務派給其他代理去執行。這對複雜的多步驟程式任務很關鍵,因為你可以讓不同代理專注在不同部分,最後再整合結果。
Responses API WebSocket 模式:之前 Responses API 是 HTTP 請求/回應模式,現在支援 WebSocket,讓連線保持常駐。對代理任務來說,這代表工具呼叫的往返延遲大幅降低。
數字:
- 20 次以上工具呼叫的任務:提速 20-40%
- Cline 團隊實測:複雜多檔案編碼任務改善約 40%
這個改善在單次問答幾乎感覺不到,但在需要大量工具呼叫的自動化編碼任務裡,差距非常明顯。
開發者已經在用 Codex 做複雜的多步驟任務,OpenAI 看到了這個使用模式,然後把基礎設施升級到真正適合這個模式的架構。
Gemini CLI v0.26.0 加入 Hooks:用程式碼控制代理迴圈
這個功能對很多人來說可能比較陌生,但對深度使用者來說影響很大。
背景:Claude Code 去年 9 月就導入了 hooks 系統,讓用戶可以在代理迴圈的特定時間點插入自訂程式碼。Google 在 Gemini CLI v0.26.0 也跟進了。
Hooks 的兩個主要掛載點:
BeforeTool hook:在代理呼叫任何工具之前執行。實際用途是什麼?比如說,在代理準備呼叫 API 之前,自動掃描指令裡有沒有 API 金鑰外洩的風險。設定這個防護機制大概只需要 5 分鐘。
AfterAgent hook:在代理完成任務之後執行。這個可以用來實作 Ralph 迴圈(讓代理跑完之後自動觸發下一個代理或任務),是多代理自動化的基礎建設。
設定優先順序:專案層 > 使用者層 > 系統層。這讓你可以在公司層級設定預設規則,然後讓個別用戶或專案覆蓋它,彈性很夠。
簡單說,hooks 讓你可以把自己對代理迴圈的控制邏輯,直接寫進工具本身,而不是每次都包一層外部腳本。
四項更新的共同點
讀到這裡,你可能已經注意到一個模式。
| 更新 | 原本的做法 | 現在直接內建 |
|---|---|---|
| Remote Control | tmux + Tailscale + SSH | /remote-control + QR code |
| Cowork 外掛市集 | 各部門各自維護整合 | 管理員統一部署 |
| Codex WebSocket | HTTP 輪詢或自建 keep-alive | WebSocket 原生支援 |
| Gemini CLI Hooks | 包外部腳本控制代理 | hooks 系統直接內建 |
四項更新做的都是同一件事:把「使用者已經在做的事」吸收進產品裡。
這不是偶然。這是一種很清楚的競爭策略。
當 Anthropic 看到開發者在用 tmux 遠端控制 Claude Code,他們沒有說「那不是我們的功能範疇」,他們說「這是我們應該做的」。當 Google 看到 Claude Code 的 hooks 系統被廣泛使用,他們也跟進了。
AI 工具的競爭,表面上看是模型能力的競賽,但在開發者工具這個領域,工作流的吸收速度才是真正的競爭焦點。功能可以複製,但如果你的工具已經成為某個工作流的一部分,用戶就沒有理由換掉它。
每一次把「用戶本來就在做的事」內建進產品,就是一次護城河加固。
這四項更新,都是在挖護城河。
訂閱電子報
獲取關於我最新專案、文章以及 AI 和 Web 開發實驗的更新。