①9月29日,深度求索公司發(fā)布新一代大語言模型DeepSeek-V3.2-Exp,并開源于HuggingFace平臺,采用稀疏Attention架構(gòu)提升效率; ②華為昇騰、寒武紀(jì)、海光信息均宣布適配該模型。
財聯(lián)社9月30日訊,9月29日,深度求索公司正式發(fā)布新一代大語言模型DeepSeek-V3.2-Exp,并于HuggingFace平臺同步開源,模型引入稀疏 Attention 架構(gòu),這種架構(gòu)能夠降低計算資源消耗并提升模型推理效率。
隨后,華為昇騰、寒武紀(jì)、海光信息均同步宣布完成適配,其中昇騰實現(xiàn)0day支持并開源推理代碼,寒武紀(jì)完成適配且開源推理引擎,海光信息達成無縫適配與深度調(diào)優(yōu),共同以軟硬件協(xié)同助力國產(chǎn)AI生態(tài)發(fā)展。
據(jù)“華為計算”微信公眾號消息,昇騰已快速基于vLLM/SGLang等推理框架完成適配部署,實現(xiàn)DeepSeek-V3.2-Exp 0day支持,并面向開發(fā)者開源所有推理代碼和算子實現(xiàn)。

寒武紀(jì)在官方微信號宣布,已同步實現(xiàn)對深度求索公司最新模型DeepSeek-V3.2-Exp的適配,并開源大模型推理引擎vLLM-MLU源代碼。依托DeepSeek-V3.2-Exp帶來的全新DeepSeek Sparse Attention機制,疊加寒武紀(jì)的極致計算效率,可大幅降低長序列場景下的訓(xùn)推成本。

海光信息同日宣布其DCU實現(xiàn)無縫適配+深度調(diào)優(yōu),做到大模型算力“零等待”部署。海光信息表示,基于GPGPU架構(gòu)強大的生態(tài)優(yōu)勢,與編程開發(fā)軟件棧DTK的特性,DeepSeek-V3.2-Exp在海光DCU上展現(xiàn)出優(yōu)異的性能,同時驗證海光DCU高通用性、高生態(tài)兼容度及自主可控的技術(shù)優(yōu)勢。
