2026年將是中國算力需求從“云端訓(xùn)練”向“訓(xùn)練+推理”雙輪驅(qū)動轉(zhuǎn)型的關(guān)鍵之年。
國金證券稱,堅定看好國內(nèi)算力產(chǎn)業(yè)鏈的“高景氣行情”,當(dāng)下AI行業(yè)訓(xùn)推共振,算力需求極速釋放,2026年將是中國算力需求從“云端訓(xùn)練”向“訓(xùn)練+推理”雙輪驅(qū)動轉(zhuǎn)型的關(guān)鍵之年,算力缺口將在更多模態(tài)和更廣場景的催化下,極速釋放。
在供需雙側(cè)強邏輯的擠壓下,預(yù)判2026年算力產(chǎn)業(yè)鏈將進入“全鏈通脹”周期,行業(yè)景氣度將從核心芯片向AIDC、云與算力服務(wù)、配套電力設(shè)備及服務(wù)器等環(huán)節(jié)全面外溢。投資策略上,鑒于字節(jié)跳動、阿里、騰訊等巨頭較為明確的資本開支趨勢,其供應(yīng)鏈具有較高的業(yè)績確定性,深度綁定頭部互聯(lián)網(wǎng)廠商(CSP)的供應(yīng)鏈公司,或?qū)@得顯著的超額收益。
01 訓(xùn)推共振,算力需求極速釋放
1. 大模型“軍備競賽”并未降溫,向更高質(zhì)量、更多模態(tài)加速進步
頭部互聯(lián)網(wǎng)廠商的護城河效應(yīng)日益顯著,字節(jié)跳動(豆包系)、阿里巴巴(通義系)、騰訊(元寶系)近期密集發(fā)布了萬億參數(shù)級的新一代主力模型,以智譜AI、DeepSeek(深度求索)、Minimax、科大訊飛為代表的“AI新勢力”亦在快速迭代其MoE架構(gòu)。更為關(guān)鍵的是,Scaling-law在多模態(tài)領(lǐng)域也已展現(xiàn)出延續(xù)性,多模態(tài)視頻生成是典型的“算力吞噬獸”,進一步顯著利好算力基礎(chǔ)設(shè)施。
字節(jié)AI全棧革新。據(jù)科創(chuàng)板日報2月12日報道,字節(jié)跳動火山引擎初步確定2026年2月14日發(fā)布豆包大模型的一系列重要升級發(fā)布,本次模型發(fā)布涉及豆包大模型2.0、音視頻創(chuàng)作模型Seedance 2.0、圖像創(chuàng)作模型Seedream 5.0 Preview。此次升級,豆包大模型2.0將正式發(fā)布,基礎(chǔ)模型能力和企業(yè)級Agent能力將有大幅提升。據(jù)字節(jié)跳動官方公眾號,2月12日豆包視頻生成模型Seedance2.0正式發(fā)布,現(xiàn)已全面接入豆包和即夢產(chǎn)品,并上線火山方舟體驗中心。
Seedance 2.0達業(yè)界SOTA水平。Seedance 2.0在運動場景下的生成可用率達到業(yè)界 SOTA 水平,其在人物動作建模方面,有著自然連貫、遵循現(xiàn)實世界運動規(guī)律的顯著優(yōu)勢。它能高保真地合成時序精密的復(fù)雜交互場景,也能在特寫鏡頭中展現(xiàn)出高度逼真的細節(jié)與嚴密的物理邏輯,宛如實拍。且Seedance 2.0能精準還原復(fù)雜腳本,保持穩(wěn)定的主體一致性。模型還具備一定的編導(dǎo)思維,分鏡設(shè)計和運鏡貼合敘事邏輯。此外,Seedance 2.0 新增了視頻編輯和視頻延長能力,每位用戶都能像導(dǎo)演一樣掌控全場。在各項評測中,Seedance 2.0 的綜合表現(xiàn)達到行業(yè)領(lǐng)先水平。
通義千問Qwen-Image-2.0發(fā)布,在文生圖和圖生圖基準測試中獲得優(yōu)越性能。根據(jù)千問大模型官方公眾號,2月10日,阿里推出Qwen-Image-2.0,新一代圖像生成基礎(chǔ)模型。Qwen-Image-2.0主要特色包括:1)更專業(yè)的文字渲染:1k token指令支持,直出專業(yè)信息圖,包括PPT/海報/漫畫等。2)更細膩的真實質(zhì)感:2k分辨率支持,細膩刻畫寫實場景,包括人物/自然/建筑等。3)更強的語義遵循:理解生成一體化,生圖編輯二合一。更輕量的模型架構(gòu):更小模型,更快速度。AI Arena模型盲測數(shù)據(jù)顯示,Qwen-Image-2.0作為一個生圖編輯二合一的模型,同一模型在文生圖和圖生圖基準中獲得優(yōu)越性能。
Deepseek模型更新,上下文長度升級、知識庫更新。據(jù)科創(chuàng)板日報2月11日報道,DeepSeek在網(wǎng)頁端和APP端進行了版本更新,支持最高1M(百萬)Token的上下文長度,而去年8月發(fā)布的DeepSeekV3.1上下文長度拓展至128K;同時,知識庫更新至2025年5月。
智譜發(fā)布新一代旗艦?zāi)P虶LM-5,在Coding與Agent能力上取得開源SOTA。2月12日,智譜上線并開源GLM-5,其在Coding與Agent能力上,取得開源SOTA表現(xiàn),在真實編程場景的使用體感逼近Claude Opus4.5,擅長復(fù)雜系統(tǒng)工程與長程Agent 任務(wù)。在全球權(quán)威的Artificial Analysis 榜單中,GLM-5位居全球第四、開源第一。GLM-5基座能力全面演進:1)參數(shù)規(guī)模擴展:從355B(激活32B)擴展至744B(激活40B),預(yù)訓(xùn)練數(shù)據(jù)從23T提升至28.5T,更大規(guī)模的預(yù)訓(xùn)練算力顯著提升了模型的通用智能水平;2)異步強化學(xué)習(xí):構(gòu)建全新的“Slime”框架,支持更大模型規(guī)模及更復(fù)雜的強化學(xué)習(xí)任務(wù),提升強化學(xué)習(xí)后訓(xùn)練流程效率;提出異步智能體強化學(xué)習(xí)算法,使模型能夠持續(xù)從長程交互中學(xué)習(xí),充分激發(fā)預(yù)訓(xùn)練模型的潛力;3)稀疏注意力機制:首次集成DeepSeek Sparse Attention,在維持長文本效果無損的同時,大幅降低模型部署成本,提升Token Efficiency。
2.推理算力需求正以超預(yù)期的斜率上升
以字節(jié)、阿里、騰訊三家大廠為例,隨著大廠圍繞AI入口展開高強度競爭,流量獲取與生態(tài)打通形成合力,推動AI從工具屬性向高頻服務(wù)入口躍遷。在用戶規(guī)模與使用深度雙提升的背景下,推理側(cè)算力需求正以超預(yù)期斜率快速抬升。
字節(jié):QuestMobile數(shù)據(jù)顯示,豆包2025年用戶規(guī)模持續(xù)增長,第四季度月均活躍用戶高達2.3億戶,連續(xù)兩個季度登頂行業(yè)榜首,月均下載用戶數(shù)也連續(xù)3個季度位居行業(yè)第一,而在豆包APP強勢登陸央視春晚后,憑借全民級曝光,其推廣程度有望再上臺階。
阿里:千問借助阿里巴巴生態(tài)的資源優(yōu)勢,打通了淘寶閃購、飛豬、盒馬、大麥、高德、支付寶等多款應(yīng)用,融合生態(tài)內(nèi)的交易體系、地理位置服務(wù)、出行資源、電商資源等能力,讓AI能夠絲滑地實現(xiàn)點外賣、購物、訂機票等相對復(fù)雜的操作,真正化身為用戶身邊的“全能管家”。數(shù)據(jù)顯示,上線兩個月,千問C端(消費者端)月活躍用戶數(shù)已突破1億,在學(xué)生和白領(lǐng)人群中增長迅猛。
騰訊:2026年開年以來,騰訊在AI領(lǐng)域動作頻頻:先是啟動社交AI“元寶派”內(nèi)測,接著狂撒10億元紅包為元寶派拉新,引發(fā)AI圈紅包大戰(zhàn)。
除了模型本身的入口流量,AI漫劇、AI編程等原生應(yīng)用的快速爆發(fā),AI醫(yī)療、智能制造等垂類模型的蓄勢待發(fā)。
多模態(tài)驅(qū)動視覺質(zhì)變及技術(shù)紅利釋放,動態(tài)漫、AI漫劇已成“爆款”。 2025年多模態(tài)技術(shù)收斂推動視覺表現(xiàn)力跨越式提升。供給端,AI大幅壓降制作周期,實現(xiàn)低成本批量化產(chǎn)出;需求端,緊湊節(jié)奏與高情緒密度精準擊中用戶痛點。供需雙側(cè)適配,驅(qū)動賽道從邊緣邁向主流。根據(jù)短劇自習(xí)室公眾號統(tǒng)計,從2025年度抖音端漫劇累計播放量TOP100榜單來看,共有52部沙雕漫、28部AI漫劇、17部動態(tài)漫、3部解說漫上榜,分別占比52%、28%、17%、3%。其中僅有1部突破5億播放——AI漫《斬仙臺下,我震驚了諸神》,10月份上線,截至26年1月初累計播放量10.6億,成為當(dāng)之無愧的2025年度“劇王”。
AI編程從輔助工具邁向原生入口,開發(fā)工作流進入Agent時代。隨著模型在長上下文理解與多文件協(xié)作能力上的突破,AI編程正由“代碼補全插件”升級為具備規(guī)劃、生成與驗證能力的編程Agent。2月2日OpenAI推出編碼助手Codex獨立App,并發(fā)布底層GPT-5.3-Codex模型,獨立應(yīng)用程序Codex在推出后的第一周下載量就超過了100萬次且Codex用戶總數(shù)環(huán)比增長60%。相比于之前的AI編程大模型,GPT-5.3-Codex“超越編程”,旨在支持軟件生命周期中的所有工作,包括調(diào)試、部署、監(jiān)控、編寫公關(guān)需求文檔 (PRD)、編輯文案、用戶研究、測試、指標分析等,可以在幾天時間內(nèi)從零開始構(gòu)建功能高度復(fù)雜的游戲和應(yīng)用程序,在SWE-Bench Pro 和 Terminal-Bench 上創(chuàng)下了行業(yè)新高,并在OSWorld和GDPval上表現(xiàn)強勁。
全球巨頭搶灘,專業(yè)化閉環(huán)重塑醫(yī)療生態(tài)。1)爆款驗證C端剛需:2025年12月25日,螞蟻集團戰(zhàn)略升級“螞蟻阿?!保瑢崿F(xiàn)從單一工具向“AI健康伙伴”的形態(tài)躍遷。發(fā)布當(dāng)日即沖至蘋果應(yīng)用商店總榜TOP3,現(xiàn)象級表現(xiàn)有力驗證了C端用戶在嚴肅健康場景下強烈的交互需求與信任交付。2)垂直閉環(huán)構(gòu)筑壁壘:不同于通用大模型的泛化問答,阿福依托專業(yè)醫(yī)療底座,深度打通“智能問診-在線掛號-醫(yī)保支付”全鏈路。這種將信息流直接轉(zhuǎn)化為服務(wù)流的閉環(huán)能力,確立了其在醫(yī)療垂直場景下不可復(fù)制的競爭優(yōu)勢。3)產(chǎn)業(yè)趨勢全球共振:2026年1月8日,OpenAI跟進推出ChatGPT Health。繼螞蟻阿福之后,全球AI領(lǐng)軍者不約而同切入醫(yī)療賽道,進一步強化了該細分領(lǐng)域“高壁壘、高單價、高粘性”的產(chǎn)業(yè)邏輯,板塊配置價值顯著提升。
02 供給端外部邊際改善,內(nèi)部國產(chǎn)化加速放量
外部方面,NVIDIA H200(合規(guī)版)正式獲批進入中國市場,短期內(nèi)將有效緩解算力焦慮。據(jù)觀察者網(wǎng),1月13日,美國特朗普政府正式批準英偉達對華出口H200人工智能(AI)芯片,根據(jù)美國商務(wù)部發(fā)布聲明,商務(wù)部下屬機構(gòu)工業(yè)與安全局(BIS)正在修訂對某些半導(dǎo)體向中國出口的許可審查政策——從推定拒絕改為逐案審查。H200短期內(nèi)將有效緩解頭部互聯(lián)網(wǎng)廠商在超大規(guī)模模型訓(xùn)練上的算力焦慮,助推模型迭代速度。
國產(chǎn)算力芯片的性能與生態(tài)建設(shè)已跨過“可用”向“好用”的拐點。國產(chǎn)GPU在性能指標、軟件生態(tài)、應(yīng)用適配等方面與NV最先進一代仍有差距,但已基本追平H20、A100等,且在本地化服務(wù)、政策支持、成本控制等方面具備優(yōu)勢。隨著資本持續(xù)注入,國產(chǎn)企業(yè)有望在細分場景實現(xiàn)突破,逐步擴大市場份額。1)算力指標上:國內(nèi)多數(shù)頭部企業(yè)主流在售產(chǎn)品的 FP16/BF16 在 100-300 TFLOPS 左右,處于英偉達 A100 產(chǎn)品階段,少數(shù)廠商通過先進封裝等方式實現(xiàn)接近英偉達 H100 產(chǎn)品的算力,為國內(nèi)最先進水平;2)顯存方面:國內(nèi)企業(yè)結(jié)合自身產(chǎn)品特點,分別選擇 HBM2e、HBM2、GDDR 等顯存類型,顯存帶寬在 0.5-2TB/s 左右。
供給側(cè):上游先進制程產(chǎn)能的擴充為芯片供應(yīng)提供了底層保障。中芯國際剛剛發(fā)布的2025年全年財報顯示,2025年第四季度公司營收為24.89億美元,環(huán)比增長4.5%;在本季度增加了1.6萬片12英寸晶圓產(chǎn)能的基礎(chǔ)上,公司產(chǎn)能利用率保持在95.7%;整體8英寸產(chǎn)能利用率超過100%,整體12英寸接近滿載,這主要是產(chǎn)業(yè)鏈重構(gòu)和迭代效應(yīng)持續(xù)作用的結(jié)果。2026年全年的指引為:營收增長預(yù)計將高于同市場產(chǎn)業(yè)界的平均水平,資本開支預(yù)計與2025年大致持平。
CSP廠商加速適配,助力國產(chǎn)芯片生態(tài)建設(shè)。英特爾的X86生態(tài)、英偉達的CUDA生態(tài)之所以難以撼動,核心在于形成了“芯片 -軟件-應(yīng)用”的閉環(huán)。而當(dāng)前國產(chǎn)陣營中,華為昇騰、阿里平頭哥、壁仞科技等芯片廠商各有技術(shù)路線,生態(tài)分散問題顯著。騰訊集團高級執(zhí)行副總裁湯道生在交流中坦言,不同參數(shù)規(guī)模的AI模型需要適配不同芯片配置,當(dāng)前只能通過與多家廠商合作實現(xiàn)場景覆蓋。百度、阿里等企業(yè)加速適配國產(chǎn)芯片,推動“芯片-模型-應(yīng)用”閉環(huán)形成。
03 國產(chǎn)算力全鏈通脹,有望量價齊升
在供需雙側(cè)強邏輯的擠壓下,我們預(yù)判2026年算力產(chǎn)業(yè)鏈將進入“全鏈通脹”周期,行業(yè)景氣度將從核心芯片向AIDC、云與算力服務(wù)、配套電力設(shè)備及服務(wù)器等環(huán)節(jié)全面外溢。
CPU漲價:自25Q4起,部分CPU大廠已步入漲價周期。25年10月,據(jù)外媒TrendForce報道,英特爾公司正計劃對其第13代Raptor Lake和第14代Raptor Lake Refresh處理器進行價格調(diào)整,漲幅最高可達10%;26年1月,據(jù)外媒Wccftech報道,AMD和英特爾今年各自的服務(wù)器CPU庫存均已售罄,大部分需求來自超大規(guī)模企業(yè),他們希望將最新的服務(wù)器CPU集成到現(xiàn)有機架架構(gòu)中,這也是過去幾個季度需求顯著增長的原因,因此,據(jù)稱AMD和英特爾都計劃將服務(wù)器CPU價格提高多達15%,以確保供應(yīng)保持穩(wěn)定。
算力/云廠商漲價:1月23日,亞馬遜云科技(AWS)近日上調(diào)其EC2機器學(xué)習(xí)容量塊(Capacity Blocks for ML)價格約15%,其中p5e.48xlarge實例每小時費用由34.61美元漲至39.80美元;1月27日,谷歌云正式官宣漲價,自2026年5月1日起,對Google Cloud、CDN Interconnect、Peering以及AI與計算基礎(chǔ)設(shè)施服務(wù)進行價格調(diào)整;2月12日,智譜宣布對GLMCoding Plan套餐價格體系進行結(jié)構(gòu)性調(diào)整,整體漲幅自30%起。
AIDC投建力度持續(xù)高景氣:1)海內(nèi)外大廠CapEx持續(xù)高增,硅谷四大科技巨頭2026年CapEx將高達6500億美元,AI軍備競賽進一步加劇,具體看:亞馬遜成為四家中投入規(guī)模最大的企業(yè),將2026年資本支出目標定在2000億美元;Alphabet的資本支出計劃高達1750億美元-1850億美元,同比接近翻倍;Meta預(yù)計全年資本支出將增至1350億美元,同比增幅或達87%;微軟同期公布其第二季度資本支出同比增長 66%,預(yù)計其截至6月的財年資本支出將逼近 1050億美元。2)智算中心持續(xù)擴容,國產(chǎn)替代加速。根據(jù)IDC數(shù)據(jù),2020年中國智能算力規(guī)模為 75.0EFLOPS,到2028年預(yù)計將達到2,781.9EFLOPS,預(yù)計2020-2028 年復(fù)合增長率達到57.1%。在多維度數(shù)據(jù)與產(chǎn)業(yè)動態(tài)的交叉印證下,AI算力基礎(chǔ)設(shè)施投建力度維持高位,AIDC環(huán)節(jié)呈現(xiàn)持續(xù)高景氣擴張態(tài)勢。

