亚州人妻久草基地,三级成人无码在线视频,青青草AV午夜在线观看

國(guó)產(chǎn)模型霸榜OpenRouter token調(diào)用量暴增背后編程、智能體成決勝點(diǎn)

原創(chuàng)

2026-02-24 09:14 星期二

科創(chuàng)板日?qǐng)?bào) 宋子喬

①在OpenRouter平臺(tái)的token總調(diào)用量前五中，中國(guó)模型占據(jù)四席，合計(jì)市場(chǎng)份額超過60%；
②編程（Coding）和智能體（Agent）正成為大模型的兩大核心比拼點(diǎn)；
③當(dāng)前Token消耗呈現(xiàn)明顯的“通脹”趨勢(shì)。

《科創(chuàng)板日?qǐng)?bào)》2月24日訊（編輯宋子喬） 春節(jié)期間國(guó)產(chǎn)大模型的使用情況可謂如火如荼。OpenRouter最新周度數(shù)據(jù)顯示，平臺(tái)前十模型總token量約8.7萬億，中國(guó)模型獨(dú)占5.3萬億，占比61%。

當(dāng)周token調(diào)用量前三模型均為國(guó)產(chǎn)大模型，分別為Minimax M2.5、Kimi K2.5、GLM-5，調(diào)用量環(huán)比上周分別變動(dòng)增加197%、下降20%、增加158%。其中，MiniMax M2.5以2.45萬億token空降榜首，Kimi K2.5以1.21萬億緊隨其后，智譜GLM 5和DeepSeek V3.2分列第三、第五。

OpenRouter是全球最大的大模型API聚合平臺(tái)，可為開發(fā)者提供統(tǒng)一API接口，以訪問全球數(shù)百種大語言模型。其核心功能包括多模型調(diào)用、智能路由優(yōu)化和透明的性能排行榜，旨在解決多模型集成復(fù)雜和廠商封鎖問題。

從該平臺(tái)提供的數(shù)據(jù)看，編程（Coding）和智能體（Agent）正成為大模型的兩大核心比拼點(diǎn)。

OpenRouter整體調(diào)用量近期大幅攀升。官方確認(rèn)，M2.5帶動(dòng)了100K至1M長(zhǎng)文本區(qū)間的增量調(diào)用需求，這個(gè)區(qū)間正是智能體工作流的典型消耗場(chǎng)景。

論token調(diào)用量，在此平臺(tái)排名前三的國(guó)產(chǎn)大模型都聚焦于提升編程能力和智能體（Agent）任務(wù)的自動(dòng)化水平，是2026年初國(guó)產(chǎn)大模型在應(yīng)用層面的重要突破。

稀宇科技（MiniMax）于2月13日發(fā)布MiniMax M2.5，稱該模型為全球首個(gè)為智能體場(chǎng)景原生設(shè)計(jì)的生產(chǎn)級(jí)旗艦?zāi)Ｐ?。其發(fā)布后七天的調(diào)用量即突破3.07T tokens，憑借在編程和Agent工作流中的卓越性能與極低的成本，成為開發(fā)者首選。

月之暗面（Moonshot AI）于1月27日發(fā)布KimiK2.5，該模型采用原生多模態(tài)架構(gòu)，能通過調(diào)度多達(dá)100個(gè)“Agent分身”并行工作，將復(fù)雜任務(wù)效率提升3到10倍。該模型在多個(gè)細(xì)分榜單（如編程、工具調(diào)用）中均排名第一，其調(diào)用量遠(yuǎn)超Gemini 3和Claude模型。據(jù)澎湃新聞報(bào)道，該大模型發(fā)布不到一個(gè)月，Kimi近20天累計(jì)收入已超過2025年全年總收入，增長(zhǎng)主要受全球付費(fèi)用戶及API調(diào)用量大漲共同推動(dòng)，其中海外付費(fèi)用戶數(shù)快速增長(zhǎng)。

智譜于2月12日發(fā)布GLM-5，該模型參數(shù)規(guī)模進(jìn)一步擴(kuò)展，采用了稀疏注意力機(jī)制，是其專為復(fù)雜系統(tǒng)工程與長(zhǎng)程Agent任務(wù)設(shè)計(jì)的旗艦?zāi)Ｐ?。憑借免費(fèi)、200K上下文窗口等優(yōu)勢(shì)，該模型發(fā)布后用戶迎來高速增長(zhǎng)，智譜對(duì)Coding Plan先后進(jìn)行了限售、漲價(jià)等動(dòng)作，除夕當(dāng)天官宣全網(wǎng)尋找“算力合伙人”。

隨著AI模型應(yīng)用場(chǎng)景深化，用戶從簡(jiǎn)單問答轉(zhuǎn)向復(fù)雜工作流，如讓模型重構(gòu)代碼、改寫文件、生成文檔等，以及智能體模式普及，當(dāng)前token消耗呈現(xiàn)明顯的“通脹”趨勢(shì)。

性能提升的同時(shí)，國(guó)產(chǎn)模型仍以性價(jià)比優(yōu)勢(shì)出圈。如MiniMax M2.5和智譜GLM-5相比Claude Opus 4.6具備顯著的成本優(yōu)勢(shì)：在輸入環(huán)節(jié)，MiniMax M2.5與GLM-5的價(jià)格均為0.3美元/百萬token，而Claude Opus 4.6則高達(dá)5美元/百萬token，是前兩者的約16.7倍；在輸出環(huán)節(jié)，MiniMax M2.5的價(jià)格為1.1美元/百萬token，GLM-5為2.55美元/百萬token，而Claude Opus 4.6的輸出價(jià)格達(dá)25美元/百萬token，分別是MiniMax M2.5的約22.7倍和GLM-5的約9.8倍。

上述國(guó)產(chǎn)模型并不能完全反映國(guó)內(nèi)模型廠商的token調(diào)用量情況。據(jù)海通國(guó)際證券，數(shù)據(jù)顯示，火山引擎的大模型日均token調(diào)用量已從2024年底的2萬億增長(zhǎng)至2025年底的63萬億；阿里云外部客戶2025年日均token調(diào)用也已接近5萬億，2026年目標(biāo)至少15-20萬億，內(nèi)部業(yè)務(wù)日均調(diào)用則計(jì)劃從16-17萬億拉到100萬億。從全行業(yè)看，中國(guó)整體日均token消耗2024年初為1000億，2025年中突破30萬億，2026年2月主流大模型合計(jì)日均token消耗已到180萬億級(jí)別。

東莞證券最新研報(bào)表示，隨著國(guó)產(chǎn)模型的編程、智能體能力提升，其調(diào)用量大幅增加，國(guó)產(chǎn)大模型在編程、智能體領(lǐng)域?qū)?biāo)全球頭部模型，有望進(jìn)一步加快應(yīng)用落地，加速token消耗量上漲。

長(zhǎng)江證券此前表示，隨著編程和多模態(tài)模型和產(chǎn)品的逐步成熟，下游應(yīng)用場(chǎng)景有望被真正打開，帶來大量的高質(zhì)量token需求。參照海外AI產(chǎn)業(yè)發(fā)展規(guī)律，從資本開支投入到token需求爆發(fā)存在約兩年的滯后期。國(guó)內(nèi)大廠的AI資本開支周期較海外滯后約一年，于2024年下半年開啟。因此，國(guó)內(nèi)云廠商收入已開始兌現(xiàn)增長(zhǎng)，而token數(shù)量的真正爆發(fā)預(yù)計(jì)將在2026年到來。

閱79.28W

我要評(píng)論

反饋意見