9 月 18 日,破解華為全聯(lián)接大會(huì) 2025 在上海盛大開幕。安全會(huì)上,難題華為技術(shù)有限公司與浙江大學(xué)聯(lián)合發(fā)布了國(guó)內(nèi)首個(gè)基于昇騰千卡算力平臺(tái)的破解DeepSeek-R1-Safe基礎(chǔ)大模型。在中國(guó)工程院院士陳純、安全華為昇騰計(jì)算業(yè)務(wù)總裁張迪煊的難題見證下,浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院院長(zhǎng)、破解區(qū)塊鏈與數(shù)據(jù)安全全國(guó)重點(diǎn)實(shí)驗(yàn)室常務(wù)副主任任奎攜手華為公司Fellow、安全計(jì)算架構(gòu)與設(shè)計(jì)部部長(zhǎng)蔣銘共同完成DeepSeek-R1-Safe基礎(chǔ)大模型發(fā)布儀式。難題出席儀式現(xiàn)場(chǎng)的破解還有浙江大學(xué)網(wǎng)絡(luò)空間安全學(xué)院副院長(zhǎng)秦湛、華為計(jì)算技術(shù)開發(fā)部部長(zhǎng)楊寶川和計(jì)算高校科研與人才生態(tài)發(fā)展部部長(zhǎng)崔玫芳,安全同時(shí)多位浙江大學(xué)“百人計(jì)劃”研究員出席活動(dòng)。難題
(發(fā)布儀式)
陳純?cè)菏繉?duì)DeepSeek-R1-Safe基礎(chǔ)大模型發(fā)布表示祝賀,破解感謝華為長(zhǎng)期支持。安全他指出,難題浙江大學(xué)計(jì)算機(jī)學(xué)院已組建起一支涵蓋多位海內(nèi)外優(yōu)秀青年人才的科研團(tuán)隊(duì),并已成功依托昇騰生態(tài),實(shí)現(xiàn)了自主全流程后訓(xùn)練框架,完成了國(guó)內(nèi)首次千卡集群大模型安全訓(xùn)練。這次DeepSeek-R1-Safe的發(fā)布旨在打造安全可信的示范應(yīng)用,推動(dòng)大模型安全能力與產(chǎn)業(yè)生態(tài)協(xié)同發(fā)展。他表示希望團(tuán)隊(duì)未來與華為展開更深入合作,共同推動(dòng)我國(guó) AI 技術(shù)進(jìn)步。
中國(guó)工程院院士 陳純
張迪煊表示,自2019年以來,華為在應(yīng)對(duì)外部環(huán)境變化的過程中持續(xù)加大研發(fā)投入,突破多項(xiàng)關(guān)鍵核心技術(shù),在硬件與產(chǎn)業(yè)生態(tài)建設(shè)方面取得了一系列成果。在華為全聯(lián)接大會(huì)2025上,華為也正式推出了昇騰新一代AI硬件與全系列軟件開源開放戰(zhàn)略,覆蓋編譯器、運(yùn)行時(shí)驅(qū)動(dòng)等核心組件,致力于通過深度開放協(xié)作,聯(lián)合高校與產(chǎn)業(yè)伙伴共同推動(dòng)基礎(chǔ)軟件創(chuàng)新與AI安全能力建設(shè)。他強(qiáng)調(diào),華為堅(jiān)信,與浙江大學(xué)的緊密合作將有助于進(jìn)一步增強(qiáng)源頭創(chuàng)新能力,共同筑牢安全、可信、有競(jìng)爭(zhēng)力的AI產(chǎn)業(yè)生態(tài),為我國(guó)人工智能的高質(zhì)量發(fā)展保駕護(hù)航。
華為昇騰計(jì)算業(yè)務(wù)總裁 張迪煊
隨后,任奎詳細(xì)介紹了DeepSeek-R1-Safe-671B基礎(chǔ)大模型的核心創(chuàng)新。研發(fā)團(tuán)隊(duì)從底層入手,構(gòu)建了一套覆蓋“高質(zhì)量安全語料—平衡優(yōu)化的安全訓(xùn)練—全鏈路自主創(chuàng)新軟硬件平臺(tái)”的全流程安全后訓(xùn)練框架。在算力平臺(tái)搭建方面,團(tuán)隊(duì)首次實(shí)現(xiàn)基于昇騰千卡算力平臺(tái)的千億級(jí)參數(shù)滿血版大模型安全訓(xùn)練,系統(tǒng)性地解決了訓(xùn)練環(huán)境中的關(guān)鍵問題,構(gòu)建了服務(wù)器間環(huán)境依賴同步、數(shù)據(jù)與權(quán)重共享、協(xié)同訓(xùn)練推理等一系列開發(fā)工具。目前,模型已在ModelZoo、GitCode、GitHub、Gitee及ModelScope 等多個(gè)社區(qū)全面開源。測(cè)試結(jié)果表明,DeepSeek-R1-Safe針對(duì)有毒有害言論、政治敏感內(nèi)容、違法行為教唆等14個(gè)維度的普通有害問題整體防御成功率近100%,針對(duì)情境假設(shè)、角色扮演、加密編碼等多個(gè)越獄模式整體防御成功率超過40%。其綜合安全防御能力達(dá)83%,在同樣測(cè)試設(shè)置下超過Qwen-235B和DeepSeek-R1-671B等多個(gè)同期模型8%至15%。此外,在MMLU、GSM8K、CEVAL等通用能力基準(zhǔn)測(cè)試中,DeepSeek-R1-Safe相比于DeepSeek-R1的性能損耗在1% 以內(nèi)。這些結(jié)果表明 DeepSeek-R1-Safe不僅顯著提升了安全防護(hù)能力,也保障了模型的可用性,達(dá)成了安全能力與通用性能之間的有效平衡。
浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院院長(zhǎng)、區(qū)塊鏈與數(shù)據(jù)安全全國(guó)重點(diǎn)實(shí)驗(yàn)室常務(wù)副主任 任奎
隨后的交流討論中,全場(chǎng)與會(huì)嘉賓圍繞“AI安全治理框架構(gòu)建”“自主創(chuàng)新生態(tài)開發(fā)者培育”“校企協(xié)同創(chuàng)新機(jī)制優(yōu)化”等話題展開深入探討,一致認(rèn)為該成果為我國(guó)突破AI安全技術(shù)壁壘、構(gòu)建自主的智能生態(tài)提供了重要支撐。
據(jù)悉,浙江大學(xué)鯤鵬昇騰科教創(chuàng)新卓越中心自成立以來,始終聚焦“人才培養(yǎng)、系統(tǒng)架構(gòu)創(chuàng)新和賦能交叉學(xué)科”三大核心任務(wù),通過算力資助及專家支持,舉辦特訓(xùn)營(yíng)、研討會(huì)和專業(yè)競(jìng)賽,已形成“產(chǎn)教融合、科教融匯”的創(chuàng)新模式。此次DeepSeek-R1-Safe基礎(chǔ)大模型的發(fā)布,正是卓越中心模式下的重要成果。未來,雙方將繼續(xù)深化合作,在多模態(tài)安全模型研發(fā)、AI安全測(cè)評(píng)標(biāo)準(zhǔn)制定等領(lǐng)域持續(xù)攻關(guān),為我國(guó)人工智能高質(zhì)量發(fā)展提供堅(jiān)實(shí)基礎(chǔ)。