Meta以36億美元收購Manus嘅秘密:AI代理失敗嘅真正原因
Meta以約36億美元收購咗Manus。秘密唔係更大嘅模型,而係情境工程。以下係大多數AI代理忽略嘅關鍵。
Meta最近以約36億美元收購咗Manus,呢單收購震撼咗成個AI行業。但真正嘅重點唔係收購金額,而係Manus團隊發現咗一個令大多數AI代理失敗嘅根本問題:情境工程(Context Engineering)。
當所有人都聚焦於更大嘅模型、更長嘅情境窗口(context window)時,Manus團隊發現咗一個令人不安嘅真相:問題唔係情境唔夠大,而係我哋使用情境嘅方式根本錯晒。
幻覺臨界點:第8至9項就開始編故事
Manus團隊喺實際應用中發現咗一個關鍵嘅失敗模式。當你要求AI代理研究50間公司時,佢哋發現AI會喺第8至9間公司就開始捏造資料。
呢個唔係模型嘅bug,而係一個系統性問題。當情境不斷累積時,AI會開始:
- 混淆唔同公司嘅資料
- 重複之前嘅回應模式
- 為咗保持一致性而編造事實
- 喺細節上出現微妙但致命嘅錯誤
呢個「幻覺臨界點」(fabrication threshold)出現得咁早,令人震驚。即使係最先進嘅模型都無法避免。
點解更大嘅情境窗口反而更差
業界一直追求更長嘅情境窗口 - 100K、200K、甚至1M token。但Manus團隊發現,情境窗口越大,問題反而越嚴重:
迷失於中間(Lost in the Middle)
研究顯示,語言模型對情境開頭同結尾嘅資訊最為敏感,但對中間嘅資訊基本上視而不見。當你將50間公司嘅資料全部塞入一個情境時,第20至40間公司嘅資料基本上被忽略咗。
指數級成本上升
情境窗口唔係線性成本。一個200K token嘅情境可能需要:
- 10倍嘅計算成本
- 更長嘅回應時間
- 更高嘅失敗率
認知天花板(Cognitive Ceiling)
就算模型理論上支援1M token,實際上佢哋嘅「工作記憶」仍然有限。好似人類一樣,你可以讀一本書,但唔代表你可以同時記住每一頁嘅細節。
訓練偏差
大多數模型嘅訓練資料都係較短嘅文檔。當你俾一個100K token嘅情境時,模型係喺應對一個佢從未真正見過嘅使用場景。
真正嘅解決方案:多代理並行架構
Manus嘅突破唔係追求更大嘅情境窗口,而係分解問題,為每個子任務提供全新嘅情境。
佢哋嘅Wide Research架構做法係咁:
- 將50間公司分拆為50個獨立任務
- 啟動50個並行嘅子代理(sub-agents)
- 每個代理只專注於一間公司,擁有全新嘅情境
- 主代理負責協調同整合結果
呢個方法嘅威力喺於:
- 每個子代理都從零開始,冇累積嘅錯誤
- 並行執行,速度比順序執行快50倍
- 情境始終保持清晰,冇「迷失於中間」嘅問題
- 錯誤隔離,一個代理嘅失敗唔會影響其他代理
保留錯誤:AI代理從失敗中學習
大多數系統會隱藏或清除錯誤訊息,但Manus發現保留錯誤記錄係提升準確性嘅關鍵。
點解錯誤咁重要?
- 避免重複失敗:如果代理知道某個API調用失敗咗,佢唔會再嘗試同樣嘅方法
- 提供情境線索:錯誤訊息包含咗關於系統狀態嘅寶貴資訊
- 訓練自我修正:代理可以學識分析錯誤並調整策略
呢個類似於人類嘅學習過程 - 我哋記得失敗,從而避免重蹈覆轍。
檔案系統作為記憶體:無限擴展嘅秘密
Manus團隊發現咗一個簡單但強大嘅模式:將檔案系統視為AI嘅外部記憶體。
寫入檔案就似寫筆記
與其將所有資訊保留喺情境窗口入面,不如:
研究結果 → 寫入 research/company-001.md
中間狀態 → 寫入 state/progress.json
發現 → 寫入 findings/insights.md
每次AI需要資訊時,佢會:
- 讀取相關檔案
- 處理資訊
- 寫回結果
呢個模式令情境窗口保持精簡,同時擁有無限嘅長期記憶。
URL壓縮技術
對於網頁內容,Manus使用咗一個聰明嘅技巧:
- 唔係將全部HTML塞入情境
- 而係保留URL作為參考
- 需要時先再讀取
一個200KB嘅網頁可以壓縮成一個50字節嘅URL。呢個係4000倍嘅壓縮率。
自我複述:todo.md嘅威力
Manus團隊發現咗情境窗口嘅另一個關鍵特性:模型對情境結尾嘅資訊最為敏感。
佢哋嘅解決方案係一個持續更新嘅todo.md檔案:
# Current Task: Research Company #23
## Completed
- [x] Company 1-22 researched
- [x] API rate limit identified
## In Progress
- [ ] Fetch company #23 financial data
- [ ] Analyze market position
## Next Steps
- [ ] Companies 24-50
- [ ] Generate summary report
每次代理執行任務後,佢會更新呢個檔案,然後將佢放喺情境嘅最後。
呢個做法產生咗幾個關鍵效果:
- 將目標推到最敏感位置:情境結尾嘅資訊獲得最多關注
- 持續自我提醒:代理始終知道佢而家做緊乜嘢
- 進度追蹤:清晰嘅已完成/進行中/待辦狀態
- 錯誤恢復:如果中斷,代理可以從todo.md恢復
呢個模式類似於人類嘅「自我對話」 - 我哋會不斷提醒自己當前嘅目標同進度。
情境工程先係真正嘅護城河
Meta願意支付36億美元收購Manus,唔係因為佢哋有更好嘅模型,而係因為佢哋掌握咗情境工程嘅核心技術。
呢啲技術包括:
- 多代理架構:分解問題,並行執行,保持情境清晰
- 錯誤保留:從失敗中學習,避免重複錯誤
- 檔案系統記憶:無限擴展,精簡情境
- URL壓縮:4000倍壓縮率,突破情境限制
- 自我複述:todo.md推送目標到情境結尾,最大化關注度
當所有人都喺追求更大嘅模型時,Manus團隊發現咗一個更根本嘅真相:唔係情境唔夠大,而係我哋使用情境嘅方式錯咗。
如果你而家仲喺構建順序執行、單一情境嘅AI代理,你已經輸咗。情境工程唔係附加功能,而係決定AI代理成敗嘅核心競爭力。
參考資料
訂閱通訊
獲取關於我最新項目、文章同埋 AI 和 Web 開發實驗嘅更新。