2025 年 9 月 29 日,強強求索深度求索公司發布新一代模型架構 DeepSeek-V3.2 ,聯手引發行業廣泛關注。深度免費的黃色視頻APP下載令人矚目的寒武是,在該大模型發布的紀同同時,寒武紀也官宣了對 DeepSeek-V3.2 的步發布適配,并開源大模型推理引擎 vLLM 源代碼。強強求索
深度求索公司正式發布的聯手 DeepSeek-V3.2-Exp 模型,是深度一個實驗性(Experimental)的版本。作為邁向新一代架構的寒武中間步驟,V3.2-Exp 在 V3.1-Terminus 的紀同基礎上引入了 DeepSeek Sparse Attention(一種稀疏注意力機制),針對長文本的步發布訓練和推理效率進行了探索性的優化和驗證。
目前,強強求索免費的黃色視頻APP下載DeepSeek 官方 App、聯手網頁端、深度小程序均已同步更新為 DeepSeek-V3.2-Exp,同時 API 大幅度降價,歡迎廣大用戶體驗測試并提供反饋意見。
同時,寒武紀已同步實現對深度求索公司最新模型 DeepSeek-V3.2-Exp 的適配,并開源大模型推理引擎 vLLM-MLU 源代碼。代碼地址和測試步驟見文末,開發者可以在寒武紀軟硬件平臺上第一時間體驗 DeepSeek-V3.2-Exp 的亮點。
這一同步發布適配的“高能”操作,在業內專家看來,背后蘊含著中國頂尖科技企業深度協同的重要信號。
從技術層面來看,這款新大模型的體量相當可觀,達到了 671GB 。據行業測算,在帶寬充足的理想條件下,僅完成該大模型的下載,就需要耗費約 8-10 個小時。而芯片與大模型的適配,涉及底層架構優化、算力資源匹配、兼容性調試等一系列復雜工作,絕非短時間內能夠完成。
有 AI 行業資深專家分析指出:“如此快速的適配響應,充分說明寒武紀早在 DeepSeek-V3.2 發布前就已啟動適配研發,雙方在技術層面的溝通與協作早已悄然展開。雙方都是低調務實的公司,前期秘而不宣,估計早就已經相向而行了。”拒絕炒作、專注技術,正是當下中國頂尖科技企業行事風格的典型體現。
全球 AI 競爭日趨激烈,中國 AI 產業要想在國際舞臺上站穩腳跟、占據優勢地位,離不開頭部企業間的深度協同合作。此次大模型與 AI 芯片領軍企業的快速聯動,正是國內高科技企業協同創新的有力例證。
我們可以期待,本次產業鏈上下游領軍企業的深度協同,將大幅降低大模型用戶在長序列場景下的訓推成本,助力 AI 應用的 “涌現”。