2026年AI五大預測:智能代理、晶片同歷史性Exit
由SaaS末日到模型專用晶片,關於2026年AI走向嘅五個大膽預測:大概有50%把握講啱。
老實講,我一直猶豫緊要唔要寫預測文章。同共同創辦人Hyeonji Hwang私底下傾係一回事,公開寫出嚟又係另一回事。
估中咗人哋話「咁都估唔到?」,估錯咗就好尷尬。但2026年開年以嚟發生嘅事,速度實在唔尋常,所以我決定整理吓自己嘅諗法。
開發者(其實係所有人)今年唔會被取代,但由今年開始要搵新嘅能力方向
作為一個生物工程專業出身嘅人,幾日前有一條消息令我好震撼。人類基因組測序成本25年前係27億美元(人類基因組計劃),5年前降到1,000美元,呢個星期Element Biosciences發布咗100美元嘅設備VITARI。即使喺生物科技呢個變化最慢嘅領域之一,速度都已經咁快。大部分行業嘅變革速度只會更快。
而軟件行業仲要快好多。流動裝置時代設備更換週期慢,人哋有時間適應;但AI係以日為單位喺度變,呢個就係軟件嘅本質。
- 2024年 Cursor普及 → Bolt·Lovable全端應用生成 → Karpathy嘅「氛圍寫code」→ 2025年 Claude Code·Opus 4.5·Gemini 3.0 Pro發布 → 2026年1月 SaaS末日(SaaSpocalypse)。淨係兩年就行到呢一步
- SaaS末日:淨係2月第一個星期,軟件板塊市值就蒸發咗2,850億美元。Anthropic嘅Claude Cowork外掛發布係導火線。呢種感覺同ChatGPT面世(2022年12月)之後嘅2023年初一模一樣
- 美國基建軟件工程師仍然短缺,但其他職位喺統計數據上已經受到衝擊。初級軟件工程師招聘相比2023年減少咗45%
今後,就算淨係跟住資訊流,都只有嗰啲同時運行幾十個智能代理嘅少數人先至做到。我以開發者為例,但每個人都應該提前培養其他能力, , 外判銷售能力、社交媒體溝通能力、穩定嘅投資收益管理等。
軟件只有作為數據源提供者或AI方案包裝先至存活到
由用家角度嚟睇,係原版定係仿品根本唔重要。打官司都只係嘥時間,所以濫用嘅一方越嚟越多。喺AI時代真正有價值嘅係嗰啲模型難以學習、但能夠喺推論時即時調用嘅數據。
呢個趨勢喺1月就已經好清晰。
數據源取得:關鍵係連接,唔係訓練
- Perplexity同BlueMatrix合作,將機構投資者金融研究數據直接整合到佢哋Enterprise產品入面(1月13日宣布)
- Manus同SimilarWeb合作,透過MCP伺服器將網站/應用流量數據接入,令AI智能代理可以直接分析(同日宣布)
- 呢類數據俾模型去用遠比俾模型去學更有效。要超越累積咗多年數據嘅企業,極之困難
模型存取權包裝:月付$100-$200提供超過$10,000嘅價值
- Claude Max $100-$200/月,ChatGPT Pro $200/月,Higgsfield $149-$249/月, , 直接透過API用要花$200-$400嘅用量,被包裝成方案之後令用家覺得「呢個價錢居然有咁大價值?」
- Anthropic嘅產品負責人甚至提到「正在考慮$500/月嘅方案」,可見高端訂閱需求有幾強
- Seedance 2.0、GPT-3.5-Codex等, , 比任何人都快、以更有效嘅價錢提供獨家模型存取,呢個係AI軟件僅餘嘅價值
結論就係:建構能喺推論前半段提供嘅數據API,或者包裝AI模型存取權,或者更快噉做企業級外判。後半段嘅分析冇意義, , AI做得更好、更平。
AI智能代理引爆第五次硬件繁榮(硬件而家係為智能代理服務嘅)
OpenClaw將呢個趨勢展現得淋漓盡致。奧地利開發者Peter Steinberger打造嘅呢個開源個人智能代理,上線72小時內GitHub星標突破6萬,而家已超過14.5萬。佢透過WhatsApp、Telegram、Slack等即時通訊應用自動完成郵件管理、行程安排、網頁瀏覽甚至購物。DigitalOcean推出咗一鍵部署,Raspberry Pi發布咗官方指南。
問題由呢度開始。
- 智能代理必須喺用家需要嘅時候即時回應,所以每個智能代理需要一部獨立裝置(或實例)
- 淨係「一人一智能代理」嘅概念就能令而家運算需求翻倍以上。如果一個人運行10個、100個個人智能代理呢?
- 裝置 = CPU等運算能力 + DRAM·SSD等儲存 + 網絡設備嘅組合。用伺服器或Mac Mini等運算裝置,每個人/每個智能代理喺獨立嘅Docker容器入面運行
- 有啲工作用傳統晶片就做到,呢個對中國企業嚟講係巨大機會。三星同SK海力士猶豫之後重新動工擴產線,原因可能就喺呢度
(feat. 三星、SK海力士、台積電、SanDisk:參照輝達嘅案例,估值可能仍然偏低。但唔同輝達,中國作為替代方案嘅存在都係一個陷阱)
每個AI模型都有專屬晶片嘅時代開啟咗(The Model is the CHIP)
加拿大多倫多嘅Taalas發布咗專為Llama 3.1 8B設計嘅ASIC晶片HC1。結果係每秒17,000個token, , 比Nvidia H200快73倍,比而家最快嘅Cerebras都快大約10倍。透過將模型權重直接刻入電晶體,HC1唔需要HBM亦唔需要液冷,功耗只有十分之一。
Taalas累計募資2.19億美元,計劃喺HC2入面支援200億參數嘅模型。
值得留意嘅係,所有人都話呢啲晶片能效唔掂、冇辦法擴展,但到最後專用晶片初創公司仲係吸引到大量資本。
- 12月24日 Nvidia以200億美元授權Groq嘅LPU技術,並引入核心人才(創辦人Jonathan Ross、總裁Sunny Madra), , 實質上係收購
- Cerebras撤回IPO,募資超10億美元,堅持獨立路線
- 模型專用晶片只需要換兩塊光罩,大約2個月就可以適配新模型, , 同前沿模型結合之後,可能徹底改變推論成本結構
一個新嘅半導體時代正在明確展開。
一間類似OpenClaw嘅初創公司將喺年內完成歷史性Exit
呢個預測嘅依據係一個已經成立咗嘅模式。
模式嘅建立:Browser-use → Manus → Meta收購
- 2025年,開源項目Browser-use展示咗AI自動化嘅可能性
- Manus將Sonnet 4同Browser-use結合,開啟咗智能代理時代(2025年3月)
- 結果:8個月內超高速達成**$100M ARR**。12月29日Meta以超過20億美元收購。史上最短獨角獸Exit案例之一
下一個Exit嘅要素:OpenClaw → pi-mono → ?
- OpenClaw本身就係開源嘅,創辦人Peter Steinberger已確認喺2月15日加入OpenAI。OpenClaw以基金會形式獨立營運
- OpenClaw嘅引擎pi-mono(Mario Zechner開發,大約8,900 GitHub星標)正在成為個人智能代理服務嘅核心SDK
- 中國方面,阿里巴巴、騰訊、字節跳動都已發布針對OpenClaw優化嘅智能代理。Minimax M2.5、Kimi Claw等模型同服務都喺轉向OpenClaw相容
- 用家期望正由「問ChatGPT」轉向「俾智能代理嚟做」。只要稍微放開數據存取權限,便利性就係壓倒性嘅
我好有信心會有大約3個極其出色噉利用pi-mono嘅服務出現,其中一個會被收購。
訂閱通訊
獲取關於我最新項目、文章同埋 AI 和 Web 開發實驗嘅更新。