強(qiáng)強(qiáng)聯(lián)手!深度求索、寒武紀(jì)同步發(fā)布DeepSeek
2025 年 9 月 29 日,強(qiáng)強(qiáng)求索深度求索公司發(fā)布新一代模型架構(gòu) DeepSeek-V3.2 ,聯(lián)手引發(fā)行業(yè)廣泛關(guān)注。深度13禁?????????毛爿令人矚目的寒武是,在該大模型發(fā)布的紀(jì)同同時(shí),寒武紀(jì)也官宣了對(duì) DeepSeek-V3.2 的步發(fā)布適配,并開源大模型推理引擎 vLLM 源代碼。強(qiáng)強(qiáng)求索
深度求索公司正式發(fā)布的聯(lián)手 DeepSeek-V3.2-Exp 模型,是深度一個(gè)實(shí)驗(yàn)性(Experimental)的版本。作為邁向新一代架構(gòu)的寒武中間步驟,V3.2-Exp 在 V3.1-Terminus 的紀(jì)同基礎(chǔ)上引入了 DeepSeek Sparse Attention(一種稀疏注意力機(jī)制),針對(duì)長(zhǎng)文本的步發(fā)布訓(xùn)練和推理效率進(jìn)行了探索性的優(yōu)化和驗(yàn)證。
目前,強(qiáng)強(qiáng)求索13禁?????????毛爿DeepSeek 官方 App、聯(lián)手網(wǎng)頁端、深度小程序均已同步更新為 DeepSeek-V3.2-Exp,同時(shí) API 大幅度降價(jià),歡迎廣大用戶體驗(yàn)測(cè)試并提供反饋意見。
同時(shí),寒武紀(jì)已同步實(shí)現(xiàn)對(duì)深度求索公司最新模型 DeepSeek-V3.2-Exp 的適配,并開源大模型推理引擎 vLLM-MLU 源代碼。代碼地址和測(cè)試步驟見文末,開發(fā)者可以在寒武紀(jì)軟硬件平臺(tái)上第一時(shí)間體驗(yàn) DeepSeek-V3.2-Exp 的亮點(diǎn)。
這一同步發(fā)布適配的“高能”操作,在業(yè)內(nèi)專家看來,背后蘊(yùn)含著中國(guó)頂尖科技企業(yè)深度協(xié)同的重要信號(hào)。
從技術(shù)層面來看,這款新大模型的體量相當(dāng)可觀,達(dá)到了 671GB 。據(jù)行業(yè)測(cè)算,在帶寬充足的理想條件下,僅完成該大模型的下載,就需要耗費(fèi)約 8-10 個(gè)小時(shí)。而芯片與大模型的適配,涉及底層架構(gòu)優(yōu)化、算力資源匹配、兼容性調(diào)試等一系列復(fù)雜工作,絕非短時(shí)間內(nèi)能夠完成。
有 AI 行業(yè)資深專家分析指出:“如此快速的適配響應(yīng),充分說明寒武紀(jì)早在 DeepSeek-V3.2 發(fā)布前就已啟動(dòng)適配研發(fā),雙方在技術(shù)層面的溝通與協(xié)作早已悄然展開。雙方都是低調(diào)務(wù)實(shí)的公司,前期秘而不宣,估計(jì)早就已經(jīng)相向而行了。”拒絕炒作、專注技術(shù),正是當(dāng)下中國(guó)頂尖科技企業(yè)行事風(fēng)格的典型體現(xiàn)。
全球 AI 競(jìng)爭(zhēng)日趨激烈,中國(guó) AI 產(chǎn)業(yè)要想在國(guó)際舞臺(tái)上站穩(wěn)腳跟、占據(jù)優(yōu)勢(shì)地位,離不開頭部企業(yè)間的深度協(xié)同合作。此次大模型與 AI 芯片領(lǐng)軍企業(yè)的快速聯(lián)動(dòng),正是國(guó)內(nèi)高科技企業(yè)協(xié)同創(chuàng)新的有力例證。
我們可以期待,本次產(chǎn)業(yè)鏈上下游領(lǐng)軍企業(yè)的深度協(xié)同,將大幅降低大模型用戶在長(zhǎng)序列場(chǎng)景下的訓(xùn)推成本,助力 AI 應(yīng)用的 “涌現(xiàn)”。
本文地址:http://www.omnznsy.cn/news/29b2499946.html
版權(quán)聲明
本文僅代表作者觀點(diǎn),不代表本站立場(chǎng)。
本文系作者授權(quán)發(fā)表,未經(jīng)許可,不得轉(zhuǎn)載。