2026年AI五大預測:智慧代理、晶片與歷史性Exit
從SaaS末日到模型專用晶片,關於2026年AI走向的五個大膽預測:大概有50%的把握說對。
老實說,我一直在猶豫要不要寫預測文章。跟共同創辦人Hyeonji Hwang私下聊是一回事,公開寫出來又是另一回事。
猜對了別人說「這不是很明顯嗎」,猜錯了就很丟臉。但2026年開年以來發生的事情,速度實在不尋常,所以我決定整理一下自己的想法。
開發者(其實是所有人)今年不會被取代,但從今年起必須尋找新的能力方向
身為一個生物工程專業出身的人,幾天前有一條消息讓我非常震撼。人類基因體定序成本25年前是27億美元(人類基因體計畫),5年前降到1,000美元,這週Element Biosciences發表了100美元的設備VITARI。即使在生物科技這個變化最慢的領域之一,速度都已經如此之快。大多數產業的變革速度只會更快。
而軟體產業要快得多。行動裝置時代設備更換週期慢,人們有時間適應;但AI是以天為單位在變化的,這就是軟體的本質。
- 2024年 Cursor普及 → Bolt·Lovable全端應用生成 → Karpathy的「氛圍寫程式」→ 2025年 Claude Code·Opus 4.5·Gemini 3.0 Pro發布 → 2026年1月 SaaS末日(SaaSpocalypse)。僅僅兩年就走到了這一步
- SaaS末日:僅2月第一週,軟體板塊市值就蒸發了2,850億美元。Anthropic的Claude Cowork外掛發布是導火線。這種感覺跟ChatGPT問世(2022年12月)後的2023年初如出一轍
- 美國基礎設施軟體工程師仍然短缺,但其他職位在統計數據上已經受到衝擊。初階軟體工程師招募相比2023年減少了45%
今後,哪怕僅僅是跟上資訊流,也只有那些同時運行幾十個智慧代理的少數人才能做到。我以開發者為例,但每個人都應該提前培養其他能力, , 外包銷售能力、社群媒體溝通能力、穩定的投資收益管理等。
軟體只有作為資料源提供者或AI方案包裝才能存活
從使用者角度來看,是原版還是仿品根本不重要。打官司也只是浪費時間,所以濫用的一方越來越多。在AI時代真正有價值的是那些模型難以學習、但能在推論時即時調用的資料。
這個趨勢在1月就已經非常清晰了。
資料源取得:關鍵是連接,不是訓練
- Perplexity與BlueMatrix達成合作,將機構投資者金融研究資料直接整合到其Enterprise產品中(1月13日宣布)
- Manus與SimilarWeb合作,透過MCP伺服器將網站/應用流量資料接入,讓AI智慧代理可以直接分析(同日宣布)
- 這類資料讓模型去用遠比讓模型去學更有效。要超過累積了多年資料的企業,極其困難
模型存取權包裝:月付$100-$200提供超過$10,000的價值
- Claude Max $100-$200/月,ChatGPT Pro $200/月,Higgsfield $149-$249/月, , 直接透過API使用要花$200-$400的用量,被包裝成方案後讓使用者覺得「這個價格居然有這麼大價值?」
- Anthropic的產品負責人甚至提到「正在考慮$500/月的方案」,可見高端訂閱需求之強
- Seedance 2.0、GPT-3.5-Codex等, , 比任何人都更快、以更有效的價格提供獨家模型存取,這是AI軟體僅剩的價值
結論就是:建構能在推論前半段提供的資料API,或者包裝AI模型存取權,或者更快地做企業級外包。後半段的分析沒有意義, , AI做得更好、更便宜。
AI智慧代理引爆第五次硬體繁榮(硬體現在是為智慧代理服務的)
OpenClaw把這個趨勢展現得淋漓盡致。奧地利開發者Peter Steinberger打造的這個開源個人智慧代理,上線72小時內GitHub星標突破6萬,目前已超過14.5萬。它透過WhatsApp、Telegram、Slack等即時通訊應用自動完成郵件管理、行程安排、網頁瀏覽甚至購物。DigitalOcean推出了一鍵部署,Raspberry Pi發布了官方指南。
問題從這裡開始。
- 智慧代理必須在使用者需要時即時回應,所以每個智慧代理需要一台獨立裝置(或實例)
- 僅「一人一智慧代理」的概念就能讓目前運算需求翻倍以上。如果一個人運行10個、100個個人智慧代理呢?
- 裝置 = CPU等運算能力 + DRAM·SSD等儲存 + 網路設備的組合。用伺服器或Mac Mini等運算裝置,每個人/每個智慧代理在獨立的Docker容器中運行
- 有些工作用傳統晶片就能完成,這對中國企業來說是巨大機會。三星和SK海力士猶豫之後重新動工擴產線,原因可能就在於此
(feat. 三星、SK海力士、台積電、SanDisk:參照輝達的案例,估值可能仍然偏低。但不同於輝達,中國作為替代方案的存在也是一個陷阱)
每個AI模型都有專屬晶片的時代開啟了(The Model is the CHIP)
加拿大多倫多的Taalas發布了專為Llama 3.1 8B設計的ASIC晶片HC1。結果是每秒17,000個token, , 比Nvidia H200快73倍,比目前最快的Cerebras也快約10倍。透過將模型權重直接刻入電晶體,HC1不需要HBM也不需要液冷,功耗僅為十分之一。
Taalas累計募資2.19億美元,計畫在HC2中支援200億參數的模型。
值得注意的是,所有人都說這些晶片能效不行、不可擴展,但最終專用晶片新創公司還是吸引了大量資本。
- 12月24日 Nvidia以200億美元授權Groq的LPU技術,並引入核心人才(創辦人Jonathan Ross、總裁Sunny Madra), , 實質上是收購
- Cerebras撤回IPO,募資超10億美元,堅持獨立路線
- 模型專用晶片只需更換兩塊光罩,約2個月即可適配新模型, , 與前沿模型結合後,可能徹底改變推論成本結構
一個新的半導體時代正在明確展開。
一家類似OpenClaw的新創公司將在年內完成歷史性Exit
這個預測的依據是一個已經成立的模式。
模式的建立:Browser-use → Manus → Meta收購
- 2025年,開源專案Browser-use展示了AI自動化的可能性
- Manus將Sonnet 4與Browser-use結合,開啟了智慧代理時代(2025年3月)
- 結果:8個月內超高速達成**$100M ARR**。12月29日Meta以超過20億美元收購。史上最短獨角獸Exit案例之一
下一個Exit的要素:OpenClaw → pi-mono → ?
- OpenClaw本身就是開源的,創辦人Peter Steinberger已確認於2月15日加入OpenAI。OpenClaw以基金會形式獨立營運
- OpenClaw的引擎pi-mono(Mario Zechner開發,約8,900 GitHub星標)正在成為個人智慧代理服務的核心SDK
- 中國方面,阿里巴巴、騰訊、字節跳動都已發布針對OpenClaw優化的智慧代理。Minimax M2.5、Kimi Claw等模型和服務都在轉向OpenClaw相容
- 使用者期望正從「問ChatGPT」轉向「讓智慧代理來做」。只要稍微放開資料存取權限,便利性就是壓倒性的
我確信會有大約3個極其出色地利用pi-mono的服務出現,其中一個會被收購。
訂閱電子報
獲取關於我最新專案、文章以及 AI 和 Web 開發實驗的更新。