目錄
2 分鐘閱讀

Anthropic、OpenAI、Google 四項更新背後的隱藏共同點

三家公司幾乎同時更新了編碼代理。方向高度重合。真正的競爭焦點不是模型,而是吸收開發者工作流的速度。

上週,Anthropic、OpenAI 和 Google 三家公司幾乎同步推出了編碼代理的重大更新。單看每一則都像是功能公告,但並排放在一起看,會發現一個很清楚的訊號:大家搶的不只是模型能力,而是誰能更快把開發者的工作流直接吸收進產品裡

以下逐一拆解這四項更新,最後再來談它們共同透露的方向。

Claude Code Remote Control:用手機掌控你的 AI 工程師

以前想在外出時繼續讓 Claude Code 跑任務,你大概要這樣做:

  1. 在遠端機器上開一個 tmux session
  2. 設定 Tailscale 讓手機連回家裡的開發機
  3. 打開 SSH,接上 tmux
  4. 然後希望網路夠穩

Anthropic 這次直接把這條流程砍掉,改成一個指令:/remote-control

輸入之後,Claude Code 產生一組 QR code。手機掃一下,工作階段立刻轉移過去。就這樣。

幾個值得注意的細節:

  • 筆電闔上自動重連:不用擔心裝置休眠斷線,重開就接回去
  • 本地檔案系統不受影響:工作階段移到手機,但工具還是跑在你的機器上,MCP 伺服器同樣不受干擾
  • Max 方案研究預覽:這次更新目前是 Max 方案用戶的研究功能預覽,還不是正式全量開放

從用戶體驗的角度來說,這個更新的本質是:Anthropic 發現很多人在用一堆土炮工具做遠端控制這件事,然後決定直接把這個使用場景吸收進來

Cowork 企業擴展:外掛市集才是真正的護城河

Cowork 是 Anthropic 面向企業的協作功能,這次更新的重點不是某個特定功能,而是整個外掛生態系的基礎建設

幾個關鍵更新:

內部專用外掛市集:管理員可以建立公司內部的外掛市集,並按照團隊或部門來部署不同的外掛組合。法務團隊和工程團隊能用到的外掛不一樣,這很合理。

新增 12 個連接器,包含 Docusign 和 FactSet。後者對金融產業的企業客戶來說是個很實際的整合。

10 種職能範本:幫助不同職能的用戶更快上手,不用每次都從空白狀態開始設定。

斜線指令結構化輸入表單:這個比較技術,但影響很大。以前斜線指令就是打文字,現在可以帶出有欄位的表單,讓輸入更結構化、更不容易出錯。

OpenTelemetry 使用量追蹤:企業客戶最在意的問題之一就是「這個 AI 工具到底用了多少、省了多少、又花了多少?」OpenTelemetry 整合讓這些數字可以進到既有的可觀測性系統裡。

與 Claude Agent SDK 使用相同外掛格式:這個細節很重要。代表你在 Cowork 裡建的外掛,和你自己用 SDK 寫的代理,是同一套介面。生態系不分裂。

說到底,外掛市集才是企業 AI 工具的真正護城河。不是因為功能,而是因為整合深度。當你的外掛格式成為標準,遷移成本就會急速上升。

Codex 子代理 + Responses API WebSocket:數字說話

OpenAI 的這兩個更新乍看是分開的,但放在一起效果很顯著。

Codex 子代理:Codex 現在正式支援子代理模式,也就是說一個主代理可以把子任務派給其他代理去執行。這對複雜的多步驟程式任務很關鍵,因為你可以讓不同代理專注在不同部分,最後再整合結果。

Responses API WebSocket 模式:之前 Responses API 是 HTTP 請求/回應模式,現在支援 WebSocket,讓連線保持常駐。對代理任務來說,這代表工具呼叫的往返延遲大幅降低。

數字:

  • 20 次以上工具呼叫的任務:提速 20-40%
  • Cline 團隊實測:複雜多檔案編碼任務改善約 40%

這個改善在單次問答幾乎感覺不到,但在需要大量工具呼叫的自動化編碼任務裡,差距非常明顯。

開發者已經在用 Codex 做複雜的多步驟任務,OpenAI 看到了這個使用模式,然後把基礎設施升級到真正適合這個模式的架構。

Gemini CLI v0.26.0 加入 Hooks:用程式碼控制代理迴圈

這個功能對很多人來說可能比較陌生,但對深度使用者來說影響很大。

背景:Claude Code 去年 9 月就導入了 hooks 系統,讓用戶可以在代理迴圈的特定時間點插入自訂程式碼。Google 在 Gemini CLI v0.26.0 也跟進了。

Hooks 的兩個主要掛載點:

BeforeTool hook:在代理呼叫任何工具之前執行。實際用途是什麼?比如說,在代理準備呼叫 API 之前,自動掃描指令裡有沒有 API 金鑰外洩的風險。設定這個防護機制大概只需要 5 分鐘。

AfterAgent hook:在代理完成任務之後執行。這個可以用來實作 Ralph 迴圈(讓代理跑完之後自動觸發下一個代理或任務),是多代理自動化的基礎建設。

設定優先順序:專案層 > 使用者層 > 系統層。這讓你可以在公司層級設定預設規則,然後讓個別用戶或專案覆蓋它,彈性很夠。

簡單說,hooks 讓你可以把自己對代理迴圈的控制邏輯,直接寫進工具本身,而不是每次都包一層外部腳本。

四項更新的共同點

讀到這裡,你可能已經注意到一個模式。

更新原本的做法現在直接內建
Remote Controltmux + Tailscale + SSH/remote-control + QR code
Cowork 外掛市集各部門各自維護整合管理員統一部署
Codex WebSocketHTTP 輪詢或自建 keep-aliveWebSocket 原生支援
Gemini CLI Hooks包外部腳本控制代理hooks 系統直接內建

四項更新做的都是同一件事:把「使用者已經在做的事」吸收進產品裡。

這不是偶然。這是一種很清楚的競爭策略。

當 Anthropic 看到開發者在用 tmux 遠端控制 Claude Code,他們沒有說「那不是我們的功能範疇」,他們說「這是我們應該做的」。當 Google 看到 Claude Code 的 hooks 系統被廣泛使用,他們也跟進了。

AI 工具的競爭,表面上看是模型能力的競賽,但在開發者工具這個領域,工作流的吸收速度才是真正的競爭焦點。功能可以複製,但如果你的工具已經成為某個工作流的一部分,用戶就沒有理由換掉它。

每一次把「用戶本來就在做的事」內建進產品,就是一次護城河加固。

這四項更新,都是在挖護城河。

訂閱電子報

獲取關於我最新專案、文章以及 AI 和 Web 開發實驗的更新。