AI芯片版圖大洗牌 - 2026年智能體改寫咗半導體遊戲規則
Nvidia唔再係唯一答案。OpenAI簽咗Cerebras、Nvidia收購Groq、Google TPU鎖定Anthropic - 智能體時代令推理芯片需求爆發,半導體格局徹底改變。
「有Nvidia GPU咪夠晒?」
如果你上年仲係噉諗,呢個月嘅新聞應該已經令你目瞪口呆。今日OpenAI同Cerebras簽咗100億美金嘅合約,Nvidia實質上以200億美金收購咗Groq,而Google TPU亦鎖定咗同Anthropic同Meta嘅數十億美金合約。
推動AI浪潮嘅半導體版圖,已經畀人重新畫過。以下就係點解。
推理時代暴露咗GPU嘅極限
我哋已經進入咗一個智能體需要喺實時環境中思考同回應數千次嘅時代。傳統GPU本身係為訓練而設計 - 喺大批量數據上面做暴力矩陣乘法。但智能體要求嘅低延遲推理,根本就係截然不同嘅工作負載。
- 基於SRAM嘅芯片,好似Groq同Cerebras嘅產品,正正係因為呢個原因而被重新評估
- 數據搬運嘅能耗比DRAM低20至100倍,令佢哋喺大規模實時推理方面有天然優勢
訓練獎勵嘅係原始吞吐量。推理獎勵嘅係延遲同能效。贏咗上一個時代嘅硬件,唔代表自動贏到呢個時代。
科技巨頭嘅芯片多元化戰爭
只用Nvidia嘅策略已經死咗。每間大型AI公司都喺建立多芯片組合。
- OpenAI:喺Microsoft基礎設施之外擴展到Cerebras同Google TPU
- Anthropic:喺超過100萬個Google TPU上面運行,同時配合AWS Trainium同Nvidia GPU
- Intel:透過收購SambaNova嘗試重返推理市場
呢個唔係要取代Nvidia。而係要將矽晶片同工作負載做精準配對。訓練集群依然喺H100同B200上面跑。但推理機隊 - 即係真正將智能體服務畀用戶嘅嗰啲 - 越嚟越需要專門嘅架構。
採購模式已經由「我哋可以攞到幾多Nvidia GPU?」轉變為「對於我哋嘅推理同訓練比例,最優嘅矽晶片組合係乜?」
中國正在完成自己嘅生態系統
就喺噚日,智譜AI發布咗GLM-Image - 一個完全喺華為昇騰芯片上面訓練嘅開源圖像生成模型。佢喺開源圖像生成器中達到咗最先進水平。
- 呢個證明咗喺美國出口限制之下,國產芯片生態系統係真係行得通
- 冇半導體主權就冇AI主權 - 中國正在將呢個原則付諸實行
影響遠唔止地緣政治層面。呢件事說明AI芯片市場正在分裂成唔同嘅區域生態系統,各自有自己嘅供應鏈、優化堆疊同競爭動態。
呢一切對未來意味住乜
由以GPU為中心嘅訓練轉向推理專用矽晶片,係結構性轉變,唔係週期性波動。智能體唔會批量處理查詢 - 佢哋係實時串流、分支同迭代。能夠高效服務呢種工作負載嘅芯片架構,將會捕獲下一波基礎設施投資。
對全球半導體公司嚟講,問題已經唔再係要唔要喺GPU之外做多元化。而係喺新版圖定型之前,你可以幾快喺推理經濟中搶佔到一個位置。
訂閱通訊
獲取關於我最新項目、文章同埋 AI 和 Web 開發實驗嘅更新。