目錄
1 分鐘閱讀

2026年AI五大預測:智能代理、晶片同歷史性Exit

由SaaS末日到模型專用晶片,關於2026年AI走向嘅五個大膽預測:大概有50%把握講啱。

老實講,我一直猶豫緊要唔要寫預測文章。同共同創辦人Hyeonji Hwang私底下傾係一回事,公開寫出嚟又係另一回事。

估中咗人哋話「咁都估唔到?」,估錯咗就好尷尬。但2026年開年以嚟發生嘅事,速度實在唔尋常,所以我決定整理吓自己嘅諗法。

開發者(其實係所有人)今年唔會被取代,但由今年開始要搵新嘅能力方向

作為一個生物工程專業出身嘅人,幾日前有一條消息令我好震撼。人類基因組測序成本25年前係27億美元(人類基因組計劃),5年前降到1,000美元,呢個星期Element Biosciences發布咗100美元嘅設備VITARI。即使喺生物科技呢個變化最慢嘅領域之一,速度都已經咁快。大部分行業嘅變革速度只會更快。

而軟件行業仲要快好多。流動裝置時代設備更換週期慢,人哋有時間適應;但AI係以日為單位喺度變,呢個就係軟件嘅本質。

  • 2024年 Cursor普及 → Bolt·Lovable全端應用生成 → Karpathy嘅「氛圍寫code」→ 2025年 Claude Code·Opus 4.5·Gemini 3.0 Pro發布 → 2026年1月 SaaS末日(SaaSpocalypse)。淨係兩年就行到呢一步
  • SaaS末日:淨係2月第一個星期,軟件板塊市值就蒸發咗2,850億美元。Anthropic嘅Claude Cowork外掛發布係導火線。呢種感覺同ChatGPT面世(2022年12月)之後嘅2023年初一模一樣
  • 美國基建軟件工程師仍然短缺,但其他職位喺統計數據上已經受到衝擊。初級軟件工程師招聘相比2023年減少咗45%

今後,就算淨係跟住資訊流,都只有嗰啲同時運行幾十個智能代理嘅少數人先至做到。我以開發者為例,但每個人都應該提前培養其他能力, , 外判銷售能力、社交媒體溝通能力、穩定嘅投資收益管理等。

軟件只有作為數據源提供者或AI方案包裝先至存活到

由用家角度嚟睇,係原版定係仿品根本唔重要。打官司都只係嘥時間,所以濫用嘅一方越嚟越多。喺AI時代真正有價值嘅係嗰啲模型難以學習、但能夠喺推論時即時調用嘅數據。

呢個趨勢喺1月就已經好清晰。

數據源取得:關鍵係連接,唔係訓練

  • Perplexity同BlueMatrix合作,將機構投資者金融研究數據直接整合到佢哋Enterprise產品入面(1月13日宣布)
  • Manus同SimilarWeb合作,透過MCP伺服器將網站/應用流量數據接入,令AI智能代理可以直接分析(同日宣布)
  • 呢類數據俾模型去用遠比俾模型去學更有效。要超越累積咗多年數據嘅企業,極之困難

模型存取權包裝:月付$100-$200提供超過$10,000嘅價值

  • Claude Max $100-$200/月,ChatGPT Pro $200/月,Higgsfield $149-$249/月, , 直接透過API用要花$200-$400嘅用量,被包裝成方案之後令用家覺得「呢個價錢居然有咁大價值?」
  • Anthropic嘅產品負責人甚至提到「正在考慮$500/月嘅方案」,可見高端訂閱需求有幾強
  • Seedance 2.0、GPT-3.5-Codex等, , 比任何人都快、以更有效嘅價錢提供獨家模型存取,呢個係AI軟件僅餘嘅價值

結論就係:建構能喺推論前半段提供嘅數據API,或者包裝AI模型存取權,或者更快噉做企業級外判。後半段嘅分析冇意義, , AI做得更好、更平。

AI智能代理引爆第五次硬件繁榮(硬件而家係為智能代理服務嘅)

OpenClaw將呢個趨勢展現得淋漓盡致。奧地利開發者Peter Steinberger打造嘅呢個開源個人智能代理,上線72小時內GitHub星標突破6萬,而家已超過14.5萬。佢透過WhatsApp、Telegram、Slack等即時通訊應用自動完成郵件管理、行程安排、網頁瀏覽甚至購物。DigitalOcean推出咗一鍵部署,Raspberry Pi發布咗官方指南。

問題由呢度開始。

  • 智能代理必須喺用家需要嘅時候即時回應,所以每個智能代理需要一部獨立裝置(或實例)
  • 淨係「一人一智能代理」嘅概念就能令而家運算需求翻倍以上。如果一個人運行10個、100個個人智能代理呢?
  • 裝置 = CPU等運算能力 + DRAM·SSD等儲存 + 網絡設備嘅組合。用伺服器或Mac Mini等運算裝置,每個人/每個智能代理喺獨立嘅Docker容器入面運行
  • 有啲工作用傳統晶片就做到,呢個對中國企業嚟講係巨大機會。三星同SK海力士猶豫之後重新動工擴產線,原因可能就喺呢度

(feat. 三星、SK海力士、台積電、SanDisk:參照輝達嘅案例,估值可能仍然偏低。但唔同輝達,中國作為替代方案嘅存在都係一個陷阱)

每個AI模型都有專屬晶片嘅時代開啟咗(The Model is the CHIP)

加拿大多倫多嘅Taalas發布咗專為Llama 3.1 8B設計嘅ASIC晶片HC1。結果係每秒17,000個token, , 比Nvidia H200快73倍,比而家最快嘅Cerebras都快大約10倍。透過將模型權重直接刻入電晶體,HC1唔需要HBM亦唔需要液冷,功耗只有十分之一

Taalas累計募資2.19億美元,計劃喺HC2入面支援200億參數嘅模型。

值得留意嘅係,所有人都話呢啲晶片能效唔掂、冇辦法擴展,但到最後專用晶片初創公司仲係吸引到大量資本。

  • 12月24日 Nvidia以200億美元授權Groq嘅LPU技術,並引入核心人才(創辦人Jonathan Ross、總裁Sunny Madra), , 實質上係收購
  • Cerebras撤回IPO,募資超10億美元,堅持獨立路線
  • 模型專用晶片只需要換兩塊光罩,大約2個月就可以適配新模型, , 同前沿模型結合之後,可能徹底改變推論成本結構

一個新嘅半導體時代正在明確展開。

一間類似OpenClaw嘅初創公司將喺年內完成歷史性Exit

呢個預測嘅依據係一個已經成立咗嘅模式。

模式嘅建立:Browser-use → Manus → Meta收購

  • 2025年,開源項目Browser-use展示咗AI自動化嘅可能性
  • Manus將Sonnet 4同Browser-use結合,開啟咗智能代理時代(2025年3月)
  • 結果:8個月內超高速達成**$100M ARR**。12月29日Meta以超過20億美元收購。史上最短獨角獸Exit案例之一

下一個Exit嘅要素:OpenClaw → pi-mono → ?

  • OpenClaw本身就係開源嘅,創辦人Peter Steinberger已確認喺2月15日加入OpenAI。OpenClaw以基金會形式獨立營運
  • OpenClaw嘅引擎pi-mono(Mario Zechner開發,大約8,900 GitHub星標)正在成為個人智能代理服務嘅核心SDK
  • 中國方面,阿里巴巴、騰訊、字節跳動都已發布針對OpenClaw優化嘅智能代理。Minimax M2.5、Kimi Claw等模型同服務都喺轉向OpenClaw相容
  • 用家期望正由「問ChatGPT」轉向「俾智能代理嚟做」。只要稍微放開數據存取權限,便利性就係壓倒性嘅

我好有信心會有大約3個極其出色噉利用pi-mono嘅服務出現,其中一個會被收購。

訂閱通訊

獲取關於我最新項目、文章同埋 AI 和 Web 開發實驗嘅更新。