①到2026年,建立較為完備的算力互聯(lián)互通標準、標識和規(guī)則體系; ②通過公共算力資源的靈活調(diào)度,推動形成一張智能感知、實時發(fā)現(xiàn)、隨需獲取的算力互聯(lián)網(wǎng); ③實現(xiàn)“一點接入、全算貫通”的算力服務(wù),最終應(yīng)用于大模型訓(xùn)練。
《科創(chuàng)板日報》5月30日訊(編輯 宋子喬) 工業(yè)和信息化部今日印發(fā)《算力互聯(lián)互通行動計劃》。

其中提出,到2026年,建立較為完備的算力互聯(lián)互通標準、標識和規(guī)則體系。
設(shè)施互聯(lián)方面,推廣新型高性能傳輸協(xié)議,提升算力節(jié)點間網(wǎng)絡(luò)互聯(lián)互通水平;資源互用方面,建成國家、區(qū)域、行業(yè)算力互聯(lián)互通平臺,統(tǒng)一匯聚公共算力標識,實現(xiàn)全國頭部算力企業(yè)的公共算力資源互聯(lián);業(yè)務(wù)互通方面,推動算、存、網(wǎng)多種業(yè)務(wù)互通,實現(xiàn)跨主體、跨架構(gòu)、跨地域算力供需調(diào)度;應(yīng)用場景方面,開展算力互聯(lián)網(wǎng)試驗網(wǎng)試點,賦能產(chǎn)業(yè)普惠用算。
到2028年,基本實現(xiàn)全國公共算力標準化互聯(lián),逐步形成具備智能感知、實時發(fā)現(xiàn)、隨需獲取的算力互聯(lián)網(wǎng)。
算力互聯(lián)互通指不同主體(如企業(yè)、機構(gòu))、不同地域、不同架構(gòu)的算力資源實現(xiàn)高效連接、協(xié)同與共享,形成統(tǒng)一調(diào)度、靈活分配的算力網(wǎng)絡(luò)體系。
隨著數(shù)字化發(fā)展,各領(lǐng)域?qū)λ懔π枨蠹ぴ銮叶鄻踊瑔我凰懔Y源難以滿足復(fù)雜任務(wù)。同時,算力分布不均,部分地區(qū)或企業(yè)算力閑置,而另一些則短缺,互聯(lián)互通可優(yōu)化資源配置。
實現(xiàn)算力互聯(lián)互通的難點之一是,不同廠商和平臺的算力資源接口、協(xié)議等存在差異。對此,上述行動計劃提出,要發(fā)揮服務(wù)器龍頭企業(yè)牽引作用,聯(lián)合產(chǎn)業(yè)鏈上下游共同開展新型高速互聯(lián)總線協(xié)議設(shè)計開發(fā)應(yīng)用。鼓勵芯片、服務(wù)器、網(wǎng)絡(luò)和軟件等各領(lǐng)域主體推廣遠程直接內(nèi)存訪問等新型高性能傳輸協(xié)議技術(shù),提升傳輸層多協(xié)議兼容適配能力。
另外,行動計劃還提及與建設(shè)算力互聯(lián)網(wǎng)相關(guān)的基礎(chǔ)設(shè)施、技術(shù):
(1)高速網(wǎng)絡(luò)通信:低延遲、高帶寬網(wǎng)絡(luò)是算力互聯(lián)基礎(chǔ)。文件提出加強高速互聯(lián)總線等基礎(chǔ)軟硬件技術(shù)攻關(guān),集中力量開展高性能傳輸協(xié)議等網(wǎng)絡(luò)傳輸技術(shù)研究,推動數(shù)據(jù)通信產(chǎn)業(yè)高質(zhì)量發(fā)展,加快高性能路由器、高速無損網(wǎng)絡(luò)技術(shù)研究,支撐數(shù)據(jù)高效入算、算力無損互聯(lián)。
(2)提升數(shù)據(jù)與存儲互通能力:推動全局文件系統(tǒng)、智能分層存儲、數(shù)據(jù)壓縮與去重等存儲技術(shù)應(yīng)用,提升海量非結(jié)構(gòu)化數(shù)據(jù)的高效承載水平。促進數(shù)據(jù)調(diào)度引擎、數(shù)據(jù)調(diào)用接口、隱私計算等數(shù)據(jù)流動技術(shù)標準化,完善跨主體、跨地域數(shù)據(jù)流動機制,提高數(shù)據(jù)多池共享與流動效率。
(3)智能感知和資源調(diào)度技術(shù):文件提出,要創(chuàng)新算力資源信息檢索方式,提高算網(wǎng)調(diào)度路徑智能化感知水平,提升應(yīng)用需求和算力供給匹配精準度。充分利用云計算等技術(shù)融合算力和網(wǎng)絡(luò)資源,創(chuàng)新算力調(diào)度系統(tǒng),實現(xiàn)應(yīng)用隨需遷移和調(diào)度。
(4)強化算力網(wǎng)絡(luò)安全保障:算力互聯(lián)擴大了攻擊面,易遭受網(wǎng)絡(luò)攻擊和數(shù)據(jù)泄露。文件提出,要完善信息通信網(wǎng)絡(luò)安全防護管理體系,指導(dǎo)算力基礎(chǔ)設(shè)施建設(shè)、互聯(lián)調(diào)度、運營服務(wù)等不同主體落實國家和行業(yè)網(wǎng)絡(luò)安全管理要求、標準規(guī)范。發(fā)揮基礎(chǔ)電信網(wǎng)絡(luò)資源優(yōu)勢,推動建設(shè)國家算力網(wǎng)絡(luò)基礎(chǔ)安全服務(wù)保障平臺,打造“云、網(wǎng)、邊、端”一體協(xié)同的安全態(tài)勢感知和防護能力。
根據(jù)行動計劃,通過公共算力資源的靈活調(diào)度,推動形成一張智能感知、實時發(fā)現(xiàn)、隨需獲取的算力互聯(lián)網(wǎng),實現(xiàn)“一點接入、全算貫通”的算力服務(wù),最終應(yīng)用于大模型訓(xùn)練上。
上述文件提出,算力業(yè)務(wù)互通創(chuàng)新行動包括:引導(dǎo)基礎(chǔ)電信運營商、云服務(wù)商、數(shù)據(jù)中心服務(wù)商、多云管理服務(wù)商等,面向大模型訓(xùn)練和推理、科學(xué)計算、算力卡、云電腦等企業(yè)和個人消費級市場,創(chuàng)新“卡時”“機時”等靈活服務(wù)模式,開展供需對接、市場交易等算力調(diào)度接入服務(wù)試商用;推動多元異構(gòu)智算集群混訓(xùn)。通過研發(fā)面向大規(guī)模異構(gòu)智算集群云操作系統(tǒng),實現(xiàn)異構(gòu)萬卡、十萬卡智算集群混訓(xùn),支持萬億、十萬億規(guī)模參數(shù)的大模型訓(xùn)練。
