①在OpenRouter平臺(tái)的token總調(diào)用量前五中,中國(guó)模型占據(jù)四席,合計(jì)市場(chǎng)份額超過60%; ②編程(Coding)和智能體(Agent)正成為大模型的兩大核心比拼點(diǎn); ③當(dāng)前Token消耗呈現(xiàn)明顯的“通脹”趨勢(shì)。
《科創(chuàng)板日?qǐng)?bào)》2月24日訊(編輯 宋子喬) 春節(jié)期間國(guó)產(chǎn)大模型的使用情況可謂如火如荼。OpenRouter最新周度數(shù)據(jù)顯示,平臺(tái)前十模型總token量約8.7萬億,中國(guó)模型獨(dú)占5.3萬億,占比61%。
當(dāng)周token調(diào)用量前三模型均為國(guó)產(chǎn)大模型,分別為Minimax M2.5、Kimi K2.5、GLM-5,調(diào)用量環(huán)比上周分別變動(dòng)增加197%、下降20%、增加158%。其中,MiniMax M2.5以2.45萬億token空降榜首,Kimi K2.5以1.21萬億緊隨其后,智譜GLM 5和DeepSeek V3.2分列第三、第五。
OpenRouter是全球最大的大模型API聚合平臺(tái),可為開發(fā)者提供統(tǒng)一API接口,以訪問全球數(shù)百種大語言模型。其核心功能包括多模型調(diào)用、智能路由優(yōu)化和透明的性能排行榜,旨在解決多模型集成復(fù)雜和廠商封鎖問題。
從該平臺(tái)提供的數(shù)據(jù)看,編程(Coding)和智能體(Agent)正成為大模型的兩大核心比拼點(diǎn)。
OpenRouter整體調(diào)用量近期大幅攀升。官方確認(rèn),M2.5帶動(dòng)了100K至1M長(zhǎng)文本區(qū)間的增量調(diào)用需求,這個(gè)區(qū)間正是智能體工作流的典型消耗場(chǎng)景。
論token調(diào)用量,在此平臺(tái)排名前三的國(guó)產(chǎn)大模型都聚焦于提升編程能力和智能體(Agent)任務(wù)的自動(dòng)化水平,是2026年初國(guó)產(chǎn)大模型在應(yīng)用層面的重要突破。
稀宇科技(MiniMax)于2月13日發(fā)布MiniMax M2.5,稱該模型為全球首個(gè)為智能體場(chǎng)景原生設(shè)計(jì)的生產(chǎn)級(jí)旗艦?zāi)P?。其發(fā)布后七天的調(diào)用量即突破3.07T tokens,憑借在編程和Agent工作流中的卓越性能與極低的成本,成為開發(fā)者首選。
月之暗面(Moonshot AI)于1月27日發(fā)布KimiK2.5,該模型采用原生多模態(tài)架構(gòu),能通過調(diào)度多達(dá)100個(gè)“Agent分身”并行工作,將復(fù)雜任務(wù)效率提升3到10倍。該模型在多個(gè)細(xì)分榜單(如編程、工具調(diào)用)中均排名第一,其調(diào)用量遠(yuǎn)超Gemini 3和Claude模型。據(jù)澎湃新聞報(bào)道,該大模型發(fā)布不到一個(gè)月,Kimi近20天累計(jì)收入已超過2025年全年總收入,增長(zhǎng)主要受全球付費(fèi)用戶及API調(diào)用量大漲共同推動(dòng),其中海外付費(fèi)用戶數(shù)快速增長(zhǎng)。
智譜于2月12日發(fā)布GLM-5,該模型參數(shù)規(guī)模進(jìn)一步擴(kuò)展,采用了稀疏注意力機(jī)制,是其專為復(fù)雜系統(tǒng)工程與長(zhǎng)程Agent任務(wù)設(shè)計(jì)的旗艦?zāi)P?。憑借免費(fèi)、200K上下文窗口等優(yōu)勢(shì),該模型發(fā)布后用戶迎來高速增長(zhǎng),智譜對(duì)Coding Plan先后進(jìn)行了限售、漲價(jià)等動(dòng)作,除夕當(dāng)天官宣全網(wǎng)尋找“算力合伙人”。
隨著AI模型應(yīng)用場(chǎng)景深化,用戶從簡(jiǎn)單問答轉(zhuǎn)向復(fù)雜工作流,如讓模型重構(gòu)代碼、改寫文件、生成文檔等,以及智能體模式普及,當(dāng)前token消耗呈現(xiàn)明顯的“通脹”趨勢(shì)。
性能提升的同時(shí),國(guó)產(chǎn)模型仍以性價(jià)比優(yōu)勢(shì)出圈。如MiniMax M2.5和智譜GLM-5相比Claude Opus 4.6具備顯著的成本優(yōu)勢(shì):在輸入環(huán)節(jié),MiniMax M2.5與GLM-5的價(jià)格均為0.3美元/百萬token,而Claude Opus 4.6則高達(dá)5美元/百萬token,是前兩者的約16.7倍;在輸出環(huán)節(jié),MiniMax M2.5的價(jià)格為1.1美元/百萬token,GLM-5為2.55美元/百萬token,而Claude Opus 4.6的輸出價(jià)格達(dá)25美元/百萬token,分別是MiniMax M2.5的約22.7倍和GLM-5的約9.8倍。
上述國(guó)產(chǎn)模型并不能完全反映國(guó)內(nèi)模型廠商的token調(diào)用量情況。據(jù)海通國(guó)際證券,數(shù)據(jù)顯示,火山引擎的大模型日均token調(diào)用量已從2024年底的2萬億增長(zhǎng)至2025年底的63萬億;阿里云外部客戶2025年日均token調(diào)用也已接近5萬億,2026年目標(biāo)至少15-20萬億,內(nèi)部業(yè)務(wù)日均調(diào)用則計(jì)劃從16-17萬億拉到100萬億。從全行業(yè)看,中國(guó)整體日均token消耗2024年初為1000億,2025年中突破30萬億,2026年2月主流大模型合計(jì)日均token消耗已到180萬億級(jí)別。
東莞證券最新研報(bào)表示,隨著國(guó)產(chǎn)模型的編程、智能體能力提升,其調(diào)用量大幅增加,國(guó)產(chǎn)大模型在編程、智能體領(lǐng)域?qū)?biāo)全球頭部模型,有望進(jìn)一步加快應(yīng)用落地,加速token消耗量上漲。
長(zhǎng)江證券此前表示,隨著編程和多模態(tài)模型和產(chǎn)品的逐步成熟,下游應(yīng)用場(chǎng)景有望被真正打開,帶來大量的高質(zhì)量token需求。參照海外AI產(chǎn)業(yè)發(fā)展規(guī)律,從資本開支投入到token需求爆發(fā)存在約兩年的滯后期。國(guó)內(nèi)大廠的AI資本開支周期較海外滯后約一年,于2024年下半年開啟。因此,國(guó)內(nèi)云廠商收入已開始兌現(xiàn)增長(zhǎng),而token數(shù)量的真正爆發(fā)預(yù)計(jì)將在2026年到來。

