目錄
2 分鐘閱讀

Meta以36億美元收購Manus嘅秘密:AI代理失敗嘅真正原因

Meta以約36億美元收購咗Manus。秘密唔係更大嘅模型,而係情境工程。以下係大多數AI代理忽略嘅關鍵。

Meta最近以約36億美元收購咗Manus,呢單收購震撼咗成個AI行業。但真正嘅重點唔係收購金額,而係Manus團隊發現咗一個令大多數AI代理失敗嘅根本問題:情境工程(Context Engineering)。

當所有人都聚焦於更大嘅模型、更長嘅情境窗口(context window)時,Manus團隊發現咗一個令人不安嘅真相:問題唔係情境唔夠大,而係我哋使用情境嘅方式根本錯晒。

幻覺臨界點:第8至9項就開始編故事

Manus團隊喺實際應用中發現咗一個關鍵嘅失敗模式。當你要求AI代理研究50間公司時,佢哋發現AI會喺第8至9間公司就開始捏造資料。

呢個唔係模型嘅bug,而係一個系統性問題。當情境不斷累積時,AI會開始:

  • 混淆唔同公司嘅資料
  • 重複之前嘅回應模式
  • 為咗保持一致性而編造事實
  • 喺細節上出現微妙但致命嘅錯誤

呢個「幻覺臨界點」(fabrication threshold)出現得咁早,令人震驚。即使係最先進嘅模型都無法避免。

點解更大嘅情境窗口反而更差

業界一直追求更長嘅情境窗口 - 100K、200K、甚至1M token。但Manus團隊發現,情境窗口越大,問題反而越嚴重:

迷失於中間(Lost in the Middle)

研究顯示,語言模型對情境開頭同結尾嘅資訊最為敏感,但對中間嘅資訊基本上視而不見。當你將50間公司嘅資料全部塞入一個情境時,第20至40間公司嘅資料基本上被忽略咗。

指數級成本上升

情境窗口唔係線性成本。一個200K token嘅情境可能需要:

  • 10倍嘅計算成本
  • 更長嘅回應時間
  • 更高嘅失敗率

認知天花板(Cognitive Ceiling)

就算模型理論上支援1M token,實際上佢哋嘅「工作記憶」仍然有限。好似人類一樣,你可以讀一本書,但唔代表你可以同時記住每一頁嘅細節。

訓練偏差

大多數模型嘅訓練資料都係較短嘅文檔。當你俾一個100K token嘅情境時,模型係喺應對一個佢從未真正見過嘅使用場景。

真正嘅解決方案:多代理並行架構

Manus嘅突破唔係追求更大嘅情境窗口,而係分解問題,為每個子任務提供全新嘅情境

佢哋嘅Wide Research架構做法係咁:

  1. 將50間公司分拆為50個獨立任務
  2. 啟動50個並行嘅子代理(sub-agents)
  3. 每個代理只專注於一間公司,擁有全新嘅情境
  4. 主代理負責協調同整合結果

呢個方法嘅威力喺於:

  • 每個子代理都從零開始,冇累積嘅錯誤
  • 並行執行,速度比順序執行快50倍
  • 情境始終保持清晰,冇「迷失於中間」嘅問題
  • 錯誤隔離,一個代理嘅失敗唔會影響其他代理

保留錯誤:AI代理從失敗中學習

大多數系統會隱藏或清除錯誤訊息,但Manus發現保留錯誤記錄係提升準確性嘅關鍵

點解錯誤咁重要?

  • 避免重複失敗:如果代理知道某個API調用失敗咗,佢唔會再嘗試同樣嘅方法
  • 提供情境線索:錯誤訊息包含咗關於系統狀態嘅寶貴資訊
  • 訓練自我修正:代理可以學識分析錯誤並調整策略

呢個類似於人類嘅學習過程 - 我哋記得失敗,從而避免重蹈覆轍。

檔案系統作為記憶體:無限擴展嘅秘密

Manus團隊發現咗一個簡單但強大嘅模式:將檔案系統視為AI嘅外部記憶體

寫入檔案就似寫筆記

與其將所有資訊保留喺情境窗口入面,不如:

研究結果 → 寫入 research/company-001.md
中間狀態 → 寫入 state/progress.json
發現 → 寫入 findings/insights.md

每次AI需要資訊時,佢會:

  1. 讀取相關檔案
  2. 處理資訊
  3. 寫回結果

呢個模式令情境窗口保持精簡,同時擁有無限嘅長期記憶

URL壓縮技術

對於網頁內容,Manus使用咗一個聰明嘅技巧:

  • 唔係將全部HTML塞入情境
  • 而係保留URL作為參考
  • 需要時先再讀取

一個200KB嘅網頁可以壓縮成一個50字節嘅URL。呢個係4000倍嘅壓縮率

自我複述:todo.md嘅威力

Manus團隊發現咗情境窗口嘅另一個關鍵特性:模型對情境結尾嘅資訊最為敏感

佢哋嘅解決方案係一個持續更新嘅todo.md檔案:

# Current Task: Research Company #23

## Completed
- [x] Company 1-22 researched
- [x] API rate limit identified

## In Progress
- [ ] Fetch company #23 financial data
- [ ] Analyze market position

## Next Steps
- [ ] Companies 24-50
- [ ] Generate summary report

每次代理執行任務後,佢會更新呢個檔案,然後將佢放喺情境嘅最後

呢個做法產生咗幾個關鍵效果:

  1. 將目標推到最敏感位置:情境結尾嘅資訊獲得最多關注
  2. 持續自我提醒:代理始終知道佢而家做緊乜嘢
  3. 進度追蹤:清晰嘅已完成/進行中/待辦狀態
  4. 錯誤恢復:如果中斷,代理可以從todo.md恢復

呢個模式類似於人類嘅「自我對話」 - 我哋會不斷提醒自己當前嘅目標同進度。

情境工程先係真正嘅護城河

Meta願意支付36億美元收購Manus,唔係因為佢哋有更好嘅模型,而係因為佢哋掌握咗情境工程嘅核心技術。

呢啲技術包括:

  • 多代理架構:分解問題,並行執行,保持情境清晰
  • 錯誤保留:從失敗中學習,避免重複錯誤
  • 檔案系統記憶:無限擴展,精簡情境
  • URL壓縮:4000倍壓縮率,突破情境限制
  • 自我複述:todo.md推送目標到情境結尾,最大化關注度

當所有人都喺追求更大嘅模型時,Manus團隊發現咗一個更根本嘅真相:唔係情境唔夠大,而係我哋使用情境嘅方式錯咗。

如果你而家仲喺構建順序執行、單一情境嘅AI代理,你已經輸咗。情境工程唔係附加功能,而係決定AI代理成敗嘅核心競爭力。

參考資料

訂閱通訊

獲取關於我最新項目、文章同埋 AI 和 Web 開發實驗嘅更新。