①英偉達計劃在下一代Rubin架構中大幅提升CPU核心數(shù)。 ②英特爾與AMD在2026年的服務器CPU產(chǎn)能已基本售罄,計劃將產(chǎn)品價格上調(diào)10-15%。 ③機構總結(jié)道,Agent對CPU需求提升主要來自三方面,即應用調(diào)度壓力、高并發(fā)工具調(diào)用成為瓶頸,以及沙箱隔離抬升剛性開銷。
《科創(chuàng)板日報》1月31日訊 在很長一段時間內(nèi),市場始終將GPU和AI算力劃上等號,然而隨著AI行業(yè)步入由智能體驅(qū)動的強化學習時代,CPU正逐漸演變?yōu)樗懔Α澳就靶毕碌男露贪濉?/p>
最新研究顯示,在完整的Agent執(zhí)行鏈路中,工具處理相關環(huán)節(jié)在CPU上消耗的時間占端到端延遲的比例最高可達90.6%。在高并發(fā)場景下,CPU端到端延遲從2.9秒躍升至6.3秒以上。其結(jié)果揭示了在大量Agentic場景中,系統(tǒng)吞吐受限的并非GPU計算能力,而是CPU的核心數(shù)并發(fā)調(diào)度問題。
就在日前,GPU的超級玩家英偉達主動掏出20億美元追加認購CoreWeave股票,并聲稱后者將在其平臺上部署Vera CPU——一款專為“代理式推理(Agentic Reasoning)”設計,且在大規(guī)模AI工廠最具能效優(yōu)勢的CPU。據(jù)悉,因ARM CPU瓶頸,英偉達已計劃在下一代Rubin架構中大幅提升CPU核心數(shù),并開放NVL72機柜對x86CPU的支持。
東吳證券指出,英偉達主動提升CPU權重,等同于在系統(tǒng)層面確認:在長上下文與高并發(fā)Agent場景中,大內(nèi)存CPU是承載海量KV Cache(鍵值緩存)的最優(yōu)容器。
與此同時,由于超大規(guī)模云服務商“掃貨”,英特爾與AMD在2026全年的服務器CPU產(chǎn)能已基本售罄。為了應對供需極端失衡并確保后續(xù)供應穩(wěn)定,兩家公司均計劃將服務器CPU價格上調(diào)10-15%。其中,英特爾甚至緊急將產(chǎn)能轉(zhuǎn)向服務器端,一度導致消費電子端交付受阻。
在英特爾2025年第四季度財報電話會上,CEO陳立武表示,盡管AI時代帶來了前所未有的半導體需求,但短期內(nèi),“我對未能完全滿足市場需求感到遺憾”。
▌對話靠GPU,執(zhí)行靠CPU
是什么讓CPU從AI算力界的“冷板凳”上站起,成為需要被單獨規(guī)劃的核心資源池?國金證券等多個機構總結(jié)道,Agent對CPU需求提升主要來自三方面,即應用調(diào)度壓力、高并發(fā)工具調(diào)用成為瓶頸,以及沙箱隔離抬升剛性開銷。
應用調(diào)度壓力較好理解,當AI智能體層出不窮,服務器端整體調(diào)用頻次與覆蓋面顯著升高,便會帶來更多系統(tǒng)請求、數(shù)據(jù)搬運與控制流開銷。
至于為何CPU負載高于GPU,在東吳證券看來,Agent時代AI由“純對話”轉(zhuǎn)向了“執(zhí)行任務”,因此產(chǎn)生大量if/else判斷,這種“分支類任務”倘若由GPU執(zhí)行,會因控制流發(fā)散導致算力利用率急劇下降。與之相比,CPU的微架構卻能夠適應此類任務。
另據(jù)廣發(fā)證券,Agent時代下,大語言模型疊加了決策編排器與多類外部工具,整體計算流程演化為“感知-規(guī)劃-工具調(diào)用-再推理”的閉環(huán)結(jié)構。由于工具調(diào)用、任務調(diào)度、信息檢索等關鍵環(huán)節(jié)均依賴CPU完成,隨著Agent滲透率與工具調(diào)用密度提升,CPU作為中間調(diào)度樞紐的占用線性放大。
此外,在Agent場景下,長上下文推理會快速耗盡GPU HBM容量。為解決這一問題,業(yè)界采用KV CacheOffload技術將數(shù)據(jù)遷移至CPU內(nèi)存。如此一來,CPU搭配大容量DDR5/LPDDR5承載KV Cache與部分參數(shù),便成為了兼顧吞吐、擴展性與成本效率的主流架構選擇。
從投資層面來看,招商證券表示,海外CPU巨頭在國內(nèi)的合作商將從這一輪CPU漲價行情中直接受益。此外,國內(nèi)AI全產(chǎn)業(yè)鏈自主可控仍在不斷推進,硬件端與軟件端的生態(tài)適配正同步跟進,生態(tài)架構的升級將會對其中的各個環(huán)節(jié)提供性能上和產(chǎn)量上的雙重要求,并帶來明顯的邊際變化。
國海證券指出,超大規(guī)模數(shù)據(jù)中心已進入“升級周期”,CPU架構有較大替換需求,預計2026年服務器CPU出貨量有望增長25%。服務器CPU是AI算力與數(shù)據(jù)中心升級的核心受益環(huán)節(jié),正進入存量升級+國產(chǎn)替代+模型迭代三重共振周期,或?qū)⒂瓉韮r值重估機會。
