2026年2月25日 1 分鐘閱讀

2026年AI五大預測：智能代理、晶片同歷史性Exit

由SaaS末日到模型專用晶片，關於2026年AI走向嘅五個大膽預測：大概有50%把握講啱。

老實講，我一直猶豫緊要唔要寫預測文章。同共同創辦人Hyeonji Hwang私底下傾係一回事，公開寫出嚟又係另一回事。

估中咗人哋話「咁都估唔到？」，估錯咗就好尷尬。但2026年開年以嚟發生嘅事，速度實在唔尋常，所以我決定整理吓自己嘅諗法。

開發者（其實係所有人）今年唔會被取代，但由今年開始要搵新嘅能力方向

作為一個生物工程專業出身嘅人，幾日前有一條消息令我好震撼。人類基因組測序成本25年前係27億美元（人類基因組計劃），5年前降到1,000美元，呢個星期Element Biosciences發布咗100美元嘅設備VITARI。即使喺生物科技呢個變化最慢嘅領域之一，速度都已經咁快。大部分行業嘅變革速度只會更快。

而軟件行業仲要快好多。流動裝置時代設備更換週期慢，人哋有時間適應；但AI係以日為單位喺度變，呢個就係軟件嘅本質。

2024年 Cursor普及 → Bolt·Lovable全端應用生成 → Karpathy嘅「氛圍寫code」→ 2025年 Claude Code·Opus 4.5·Gemini 3.0 Pro發布 → 2026年1月 SaaS末日（SaaSpocalypse）。淨係兩年就行到呢一步
SaaS末日：淨係2月第一個星期，軟件板塊市值就蒸發咗2,850億美元。Anthropic嘅Claude Cowork外掛發布係導火線。呢種感覺同ChatGPT面世（2022年12月）之後嘅2023年初一模一樣
美國基建軟件工程師仍然短缺，但其他職位喺統計數據上已經受到衝擊。初級軟件工程師招聘相比2023年減少咗45%

今後，就算淨係跟住資訊流，都只有嗰啲同時運行幾十個智能代理嘅少數人先至做到。我以開發者為例，但每個人都應該提前培養其他能力, , 外判銷售能力、社交媒體溝通能力、穩定嘅投資收益管理等。

軟件只有作為數據源提供者或AI方案包裝先至存活到

由用家角度嚟睇，係原版定係仿品根本唔重要。打官司都只係嘥時間，所以濫用嘅一方越嚟越多。喺AI時代真正有價值嘅係嗰啲模型難以學習、但能夠喺推論時即時調用嘅數據。

呢個趨勢喺1月就已經好清晰。

數據源取得：關鍵係連接，唔係訓練

Perplexity同BlueMatrix合作，將機構投資者金融研究數據直接整合到佢哋Enterprise產品入面（1月13日宣布）
Manus同SimilarWeb合作，透過MCP伺服器將網站/應用流量數據接入，令AI智能代理可以直接分析（同日宣布）
呢類數據俾模型去用遠比俾模型去學更有效。要超越累積咗多年數據嘅企業，極之困難

模型存取權包裝：月付$100-$200提供超過$10,000嘅價值

Claude Max $100-$200/月，ChatGPT Pro $200/月，Higgsfield $149-$249/月, , 直接透過API用要花$200-$400嘅用量，被包裝成方案之後令用家覺得「呢個價錢居然有咁大價值？」
Anthropic嘅產品負責人甚至提到「正在考慮$500/月嘅方案」，可見高端訂閱需求有幾強
Seedance 2.0、GPT-3.5-Codex等, , 比任何人都快、以更有效嘅價錢提供獨家模型存取，呢個係AI軟件僅餘嘅價值

結論就係：建構能喺推論前半段提供嘅數據API，或者包裝AI模型存取權，或者更快噉做企業級外判。後半段嘅分析冇意義, , AI做得更好、更平。

AI智能代理引爆第五次硬件繁榮（硬件而家係為智能代理服務嘅）

OpenClaw將呢個趨勢展現得淋漓盡致。奧地利開發者Peter Steinberger打造嘅呢個開源個人智能代理，上線72小時內GitHub星標突破6萬，而家已超過14.5萬。佢透過WhatsApp、Telegram、Slack等即時通訊應用自動完成郵件管理、行程安排、網頁瀏覽甚至購物。DigitalOcean推出咗一鍵部署，Raspberry Pi發布咗官方指南。

問題由呢度開始。

智能代理必須喺用家需要嘅時候即時回應，所以每個智能代理需要一部獨立裝置（或實例）
淨係「一人一智能代理」嘅概念就能令而家運算需求翻倍以上。如果一個人運行10個、100個個人智能代理呢？
裝置 = CPU等運算能力 + DRAM·SSD等儲存 + 網絡設備嘅組合。用伺服器或Mac Mini等運算裝置，每個人/每個智能代理喺獨立嘅Docker容器入面運行
有啲工作用傳統晶片就做到，呢個對中國企業嚟講係巨大機會。三星同SK海力士猶豫之後重新動工擴產線，原因可能就喺呢度

（feat. 三星、SK海力士、台積電、SanDisk：參照輝達嘅案例，估值可能仍然偏低。但唔同輝達，中國作為替代方案嘅存在都係一個陷阱）

每個AI模型都有專屬晶片嘅時代開啟咗（The Model is the CHIP）

加拿大多倫多嘅Taalas發布咗專為Llama 3.1 8B設計嘅ASIC晶片HC1。結果係每秒17,000個token, , 比Nvidia H200快73倍，比而家最快嘅Cerebras都快大約10倍。透過將模型權重直接刻入電晶體，HC1唔需要HBM亦唔需要液冷，功耗只有十分之一。

Taalas累計募資2.19億美元，計劃喺HC2入面支援200億參數嘅模型。

值得留意嘅係，所有人都話呢啲晶片能效唔掂、冇辦法擴展，但到最後專用晶片初創公司仲係吸引到大量資本。

12月24日 Nvidia以200億美元授權Groq嘅LPU技術，並引入核心人才（創辦人Jonathan Ross、總裁Sunny Madra）, , 實質上係收購
Cerebras撤回IPO，募資超10億美元，堅持獨立路線
模型專用晶片只需要換兩塊光罩，大約2個月就可以適配新模型, , 同前沿模型結合之後，可能徹底改變推論成本結構

一個新嘅半導體時代正在明確展開。

一間類似OpenClaw嘅初創公司將喺年內完成歷史性Exit

呢個預測嘅依據係一個已經成立咗嘅模式。

模式嘅建立：Browser-use → Manus → Meta收購

2025年，開源項目Browser-use展示咗AI自動化嘅可能性
Manus將Sonnet 4同Browser-use結合，開啟咗智能代理時代（2025年3月）
結果：8個月內超高速達成**$100M ARR**。12月29日Meta以超過20億美元收購。史上最短獨角獸Exit案例之一

下一個Exit嘅要素：OpenClaw → pi-mono → ?

OpenClaw本身就係開源嘅，創辦人Peter Steinberger已確認喺2月15日加入OpenAI。OpenClaw以基金會形式獨立營運
OpenClaw嘅引擎pi-mono（Mario Zechner開發，大約8,900 GitHub星標）正在成為個人智能代理服務嘅核心SDK
中國方面，阿里巴巴、騰訊、字節跳動都已發布針對OpenClaw優化嘅智能代理。Minimax M2.5、Kimi Claw等模型同服務都喺轉向OpenClaw相容
用家期望正由「問ChatGPT」轉向「俾智能代理嚟做」。只要稍微放開數據存取權限，便利性就係壓倒性嘅

我好有信心會有大約3個極其出色噉利用pi-mono嘅服務出現，其中一個會被收購。

訂閱通訊

獲取最新 AI 洞見。