9月18日,昇騰在華為全聯接大會2025上,芯片華為輪值董事長徐直軍公布了最新的布全昇騰AI芯片路線圖。
根據路線圖顯示,球最強超華為在今年一季度已經推出了昇騰910C。節點后續將在2026年第一季度推出全新的昇騰昇騰950PR芯片,四季度推出昇騰950DT。芯片2027年四季度,布全華為將推出昇騰960芯片,球最強超2028年四季度推出昇騰970芯片。節點
從具體的昇騰技術指標來看,昇騰910C基于SIMD架構,芯片算力高達800TFLOPS(FP16)支持FP32/HF32/FP16/BF16/INT8等數據格式,布全互聯帶寬784GB/s,球最強超HBM容量為128GB、節點內存帶寬為3.2TB/s。
昇騰950PR/DT微架構將升級為SIMD/SIMT,算力達到1PFLOPS(FP8)/ 2PFLOPS(FP4),支持FP32/HF32/FP16/BF16/FP8/MXFP8 /HiF8/MXFP4/HiF4等數據格式,互聯帶寬為2TB/s。內存容量和帶寬上,昇騰950PR為144GB、4TB/s,昇騰950DT為128GB、1.6TB/s。
昇騰960微架構還是SIMD/SIMT,算力翻倍提高到2PFLOPS(FP8) /4PFLOPS(FP4),支持FP32/HF32/FP16/BF16/FP8/MXFP8/ HiF8/MXFP4/HiF4等數據格式,互聯帶寬為2.2TB/s。HBM內存容量也翻倍到288GB、帶寬達到9.6TB/s。
昇騰970微架構也是SIMD/SIMT,算力再度翻倍到4PFLOPS(FP8) /8PFLOPS(FP4),支持FP32/HF32/FP16/BF16/FP8/MXFP8/ HiF8/MXFP4/HiF4等數據格式,互聯帶寬提高到4TB/s。HBM內存容量雖然維持到288GB,但是帶寬會提高到14.4TB/s。
需要指出的,自昇騰950PR開始,昇騰AI芯片將采用華為自研的HBM。其中,昇騰950搭載自研的HBM HiBL 1.0;昇騰950DT升級至HBM HiZQ 2.0。
作為對比,英偉達Blackwell Ultra GB300的算力為15PFLOPS(FP4),配備是的288GB HBM3e,帶寬為8TB/s。
徐直軍指出,“由于我們受到美國的制裁,不能到臺積電去投片,我們單顆芯片的算力相比英偉達是有差距的。但是華為有三十多年聯人、聯機器的積累,所以我們在聯接技術上強力投資、實現突破,使得我們能夠做到萬卡級的超節點,從而一直能夠做到世界上算力最強!”
算力過去是,未來也將繼續是人工智能的關鍵,更是中國人工智能的關鍵。徐直軍認為,超節點將成為AI基礎設施建設新常態。目前CloudMatrix 384超節點累計部署300+套,服務20+客戶。
華為還將推出全球最強超節點Atlas 950 SuperPoD,算力規模8192卡,預計于今年四季度上市。
此外新一代產品Atlas 960 SuperPoD ,算力規模15488卡,預計2027年四季度上市。
徐直軍還在會上發布了全球首個通算超節點TaiShan950 SuperPoD,基于鯤鵬 950 開發,最大 16 節點(32P)、最大內存 48 TB、支持內存 / SSD / DPU 池化,計劃2026年一季度上市。徐直軍稱,其將成為大型機、小型機終結者。
“華為愿與產業界一起繼續努力,構筑起支撐我國乃至全世界AI算力需求的堅實底座。”徐直軍總結說道。