昇騰950首發(fā)!華為自研HBM內(nèi)存正式公布:最大144GB 帶寬4TB/s
9月18日消息,昇騰首發(fā)式今日舉辦的自研華為全聯(lián)接大會2025上,華為輪值董事長徐直軍首次公布了昇騰芯片演進和目標。存正
他表示,布最未來三年,大GB帶華為已經(jīng)規(guī)劃了昇騰多款芯片,昇騰首發(fā)式包括昇騰950PR、自研950DT以及昇騰960、存正970。布最其中昇騰950PR 2026年第一季度對外推出,大GB帶該芯片采用了華為自研HBM。昇騰首發(fā)式
根據(jù)現(xiàn)場公布的自研信息,昇騰950PR芯片架構(gòu)新增支持低精度數(shù)據(jù)格式,存正其中FP8/MXFP8/HIF8: 1 PFLOPS,布最MXFP4: 2 PFLOPS,大GB帶重點提升向量算力,提升互聯(lián)寬帶2.5倍,支持華為自研HBM高帶寬內(nèi)存,分為HiBL 1.0和HiZQ 2.0兩個版本。
規(guī)格方面,HiBL 1.0容量128GB,帶寬1.6TB/s;HiZQ 2.0容量144GB,帶寬4TB/s。
其中,昇騰950PR芯片采用950核心+HiBL 1.0內(nèi)存,可提升推理Prefill(預填充)性能,提升推薦業(yè)務性能。
昇騰950DT采用HiZQ 2.0內(nèi)存,可提升推理Decode(解碼)性能,提升訓練性能,提升內(nèi)存容量和帶寬。
延伸閱讀:
在大模型推理中,Prefill階段負責接收完整輸入數(shù)據(jù)(如文本或圖像),并計算緩存。這一過程需要強大的算力支持,通常由高性能芯片完成。 該階段強調(diào)算力而非內(nèi)存帶寬,因此更適合在HBM(高帶寬內(nèi)存)芯片上運行。相比之下,后續(xù)的Decode階段更依賴高速內(nèi)存?zhèn)鬏敽突ヂ?lián)方案。
HBM(High Bandwidth Memory,高帶寬內(nèi)存)是一種基于3D堆疊技術(shù)的先進DRAM解決方案,多層DRAM芯片垂直集成,顯著提升數(shù)據(jù)傳輸效率。具有超高帶寬與低延遲、高容量密度、高能效比等優(yōu)勢,能協(xié)助快速處理數(shù)據(jù)密集型的AI任務。
美國國際戰(zhàn)略研究中心(CSIS)AI專家艾倫(Gregory Allen)解釋,HBM對于制造先進AI芯片至關(guān)重要,價值約占整體芯片的一半。
AI推理需頻繁調(diào)用海量模型參數(shù)(如千億級權(quán)重)和實時輸入數(shù)據(jù)。HBM的高帶寬和大容量允許GPU直接訪問完整模型,可避免傳統(tǒng)DDR內(nèi)存因帶寬不足導致的算力閑置。對于千億參數(shù)以上的大模型,HBM可顯著提升響應速度。
當下,HBM已成為高端AI芯片的標配,訓練側(cè)滲透率接近100%,推理側(cè)隨模型復雜化加速普及。
(責任編輯:探索)
- 天際通十一福利活動開啟 0元領(lǐng)24小時流量 4重超值禮遇暢游世界
- 劉作虎官宣OPPO Find X9系列:引爆畫質(zhì)革命
- 女童被蜜蜂蜇傷30分鐘后不幸身亡:母親未選擇3分鐘可達的社區(qū)醫(yī)院
- 我真的真的很怕雞!禽類恐懼癥 到底是種什么樣的感受
- 《流放之路:降臨》不刪檔測試開啟 快來為你的“流學”研究配一張好顯卡
- 魅族22為什么要選驍龍8s Gen4 萬志強:選驍龍8 Elite要加1000元
- 小鵬汽車開啟海外本地化生產(chǎn):首批G6、G9在歐洲量產(chǎn)下線
- 海爾空調(diào)自研AI+5G成品檢測系統(tǒng)質(zhì)量創(chuàng)新高
- 哪里的人最愛買問界汽車:深圳排第一 上海僅第七
- 高碳水卻低GI的應季美食:三高也能放心吃!錯過后悔一年
- 哪家能活下來!比亞迪預警:中國車市大洗牌要來了 約100家車企將淘汰
- 全國首位機器人博士生入學上戲:跨界攻讀戲劇與影視
- 第十三屆固始與閩臺關(guān)系研討會在河南信陽舉行
- iPhone 17/16全系價格對比:標準版降價支持國補 Pro Max頂配17999元史上最貴