①截至今年9月底,我國已建成高質(zhì)量數(shù)據(jù)集總量超500PB; ②劉烈宏表示,全社會需要培育“為高質(zhì)量數(shù)據(jù)付費”的意識; ③推動數(shù)據(jù)要素與人工智能深度融合,要把握高質(zhì)量數(shù)據(jù)集、數(shù)據(jù)基礎(chǔ)設(shè)施、人才隊伍建設(shè)關(guān)鍵三點。
財聯(lián)社12月4日訊(記者 付靜)人工智能持續(xù)火熱背后,今年以來高質(zhì)量數(shù)據(jù)集受重視程度明顯增加。財聯(lián)社記者從國家數(shù)據(jù)局方面最新獲悉,截至今年9月底,我國已建成高質(zhì)量數(shù)據(jù)集總量超500PB,全社會初步實現(xiàn)了“人工智能+”到哪里,高質(zhì)量數(shù)據(jù)集建設(shè)和應(yīng)用就到哪里的良好氛圍。
“我們在工作中深刻感受到,全社會需要加大數(shù)據(jù)領(lǐng)域投入,培育‘為高質(zhì)量數(shù)據(jù)付費’的意識?!比涨罢匍_的上海2025科創(chuàng)大會上,國家發(fā)展改革委黨組成員、國家數(shù)據(jù)局黨組書記、局長劉烈宏這樣表示。
據(jù)悉,國家數(shù)據(jù)局通過定政策、促供給、建標(biāo)準(zhǔn)、強(qiáng)技術(shù)、育生態(tài),把推動數(shù)據(jù)要素賦能人工智能發(fā)展作為數(shù)據(jù)要素市場化配置改革的重點工作,加快高質(zhì)量數(shù)據(jù)集建設(shè)。此前,國家數(shù)據(jù)局聯(lián)合26個部委共同制定政策文件,以場景應(yīng)用為導(dǎo)向,推動各行業(yè)領(lǐng)域高質(zhì)量數(shù)據(jù)集建設(shè);部署了140項先行先試任務(wù),組織制定了包括高質(zhì)量數(shù)據(jù)集建設(shè)指南、檢測方法等5項技術(shù)文件,遴選推廣104個典型案例。
財聯(lián)社記者注意到,僅在11月,北京、重慶、貴州、江西等地最新相關(guān)規(guī)劃中紛紛強(qiáng)調(diào)要加快建設(shè)高質(zhì)量數(shù)據(jù)集。事實上,此前多家科技企業(yè)亦表示,在發(fā)展人工智能的過程中,數(shù)據(jù)要素受重視程度還不夠。“人工智能要發(fā)揮更大作用,生成式大模型只是第一步,未來更關(guān)鍵的是行業(yè)智能體的開發(fā)。而行業(yè)智能體的訓(xùn)練,離不開高質(zhì)量行業(yè)數(shù)據(jù)集的支撐?!苯冢晃簧鲜泄鞠嚓P(guān)負(fù)責(zé)人在接受財聯(lián)社記者采訪時表示。
今年以來,業(yè)界提出“AI-Ready”(AI就緒度)概念。據(jù)了解,AI就緒的數(shù)據(jù)集應(yīng)滿足技術(shù)可行、實用便捷與質(zhì)量保障三個遞進(jìn)級別的要求。其中,技術(shù)可行指數(shù)據(jù)集必須包含模型訓(xùn)練所需的信息要素,確保訓(xùn)練過程在技術(shù)層面具備可行性;實用便捷指數(shù)據(jù)集中包含模型訓(xùn)練所需的必要信息要素應(yīng)易于提取,無需進(jìn)行大量預(yù)處理即可直接投入訓(xùn)練使用;質(zhì)量保障指數(shù)據(jù)集不僅在形式和結(jié)構(gòu)維度上應(yīng)滿足訓(xùn)練需求,還應(yīng)能有效提高人工智能模型的性能。達(dá)到質(zhì)量保障這一級別的數(shù)據(jù)集,即高質(zhì)量數(shù)據(jù)集。
除了高質(zhì)量數(shù)據(jù)集建設(shè),劉烈宏表示,推動數(shù)據(jù)要素與人工智能深度融合,促進(jìn)數(shù)智創(chuàng)新,還要把握以下關(guān)鍵兩點:數(shù)據(jù)基礎(chǔ)設(shè)施是數(shù)智創(chuàng)新的重要載體;人才隊伍建設(shè)是數(shù)智創(chuàng)新的關(guān)鍵支撐。
具體而言,數(shù)據(jù)基礎(chǔ)設(shè)施方面,去年,國家數(shù)據(jù)局會同國家發(fā)改委、工信部印發(fā)建設(shè)指引,提出“廣泛開展試點試驗、實現(xiàn)全國大中城市基本覆蓋、建成國家數(shù)據(jù)基礎(chǔ)設(shè)施主體架構(gòu)”三步走的推進(jìn)思路,先后發(fā)布了數(shù)據(jù)基礎(chǔ)設(shè)施技術(shù)架構(gòu)、互聯(lián)互通基本要求等13項技術(shù)文件,完成了6項國家標(biāo)準(zhǔn)立項;部署了74個數(shù)據(jù)基礎(chǔ)設(shè)施先行先試任務(wù),覆蓋了80%以上省區(qū)市及科技、教育等15個重要領(lǐng)域,接入數(shù)據(jù)流通服務(wù)機(jī)構(gòu)(數(shù)交所、數(shù)據(jù)基礎(chǔ)設(shè)施運營方、數(shù)據(jù)商)近4000家,對外提供數(shù)據(jù)產(chǎn)品和服務(wù)超過1.3萬個。
人才隊伍建設(shè)方面,近日國家數(shù)據(jù)局聯(lián)合國家發(fā)改委、教育部、科技部、中組部印發(fā)了《關(guān)于加強(qiáng)數(shù)據(jù)要素學(xué)科專業(yè)建設(shè)和數(shù)字人才隊伍建設(shè)的意見》,將大力推動數(shù)據(jù)領(lǐng)域?qū)W科設(shè)置與人才培養(yǎng)模式創(chuàng)新。此外,國家數(shù)據(jù)局將和教育部將會同相關(guān)部委通過規(guī)劃和試點“雙輪驅(qū)動”,加快構(gòu)建數(shù)字人才自主培養(yǎng)新生態(tài)。
