獲悉,英偉全球人工智能算力芯片龍頭英偉達(dá)官宣,達(dá)發(fā)等推出專為長上下文工作負(fù)載設(shè)計(jì)的構(gòu)算歌亞專用GPU Rubin CPX,用于翻倍提升當(dāng)前AI推理運(yùn)算的力谷工作效率,特別是馬遜編程、視頻生成等需要超長上下文窗口的微美應(yīng)用。
推出上下文推理芯片Rubin CPX
英偉達(dá)CEO黃仁勛表示,全息起CPX是芯雄加首款專為需要一次性處理大量知識(數(shù)百萬級別tokens),并進(jìn)行人工智能推理的片群模型而構(gòu)建的芯片。需要說明的速并是,Rubin就是英偉英偉達(dá)將在明年發(fā)售的下一代頂級算力芯片,所以基于Rubin的達(dá)發(fā)等CPX預(yù)計(jì)也要到2026年底出貨。
另外,構(gòu)算歌亞Rubin CPX專門針對“數(shù)百萬tokens”級別的力谷長上下文性能進(jìn)行優(yōu)化,具備30petaFLOPs的馬遜NVFP4算力、128GB GDDR7內(nèi)存。
英偉達(dá)計(jì)劃以兩種形式提供Rubin CPX,一種是與Vera Rubin裝在同一個(gè)托盤上。對于已經(jīng)下單NVL144的用戶,英偉達(dá)也會單獨(dú)出售一整個(gè)機(jī)架的CPX芯片,數(shù)量正好匹配Rubin機(jī)架。
科技巨頭紛紛自研芯片
另一邊,據(jù)最新消息顯示,OpenAI正與美國芯片制造商博通合作,將于明年推出自家的AI芯片,擺脫英偉達(dá)的限制。這意味著,未來運(yùn)行在自家芯片上的OpenAI模型,可能會跑得更快、更省電,最終為用戶帶來更流暢、更低成本的服務(wù)體驗(yàn)。
除了OpenAI以外,谷歌正加快推動(dòng)自研張量處理單元(TPU)進(jìn)入第三方數(shù)據(jù)中心,已與倫敦云服務(wù)商Fluidstack達(dá)成合作。同時(shí),谷歌還接洽包括CoreWeave、Crusoe在內(nèi)的多家以英偉達(dá)GPU為核心的云服務(wù)商。
此外,亞馬遜和Meta同樣不甘示弱,紛紛投入重金研發(fā)自己的定制AI芯片,以驅(qū)動(dòng)其龐大的云服務(wù)和社交媒體帝國。還有xAI被曝正在自研推理芯片,代號X1,將采用臺積電3納米工藝,預(yù)計(jì)將在2026年第三季度實(shí)現(xiàn)量產(chǎn)(首批量產(chǎn)30萬塊)。
對此,招商證券表示,眼下,AI芯片自研潮興起,意味著AI基礎(chǔ)設(shè)施行業(yè)正從“單一GPU供給約束”向“多元化定制芯片方案”切換,投資邏輯邊際上從硬件壟斷走向生態(tài)博弈,把握相關(guān)產(chǎn)業(yè)鏈的自主可控機(jī)遇。
微美全息加強(qiáng)關(guān)鍵核心技術(shù)突破
不僅如此,據(jù)了解,微美全息作為量子科技及AI芯片領(lǐng)域的重要參與者,布局涵蓋量子計(jì)算硬件、開源生態(tài)及跨領(lǐng)域技術(shù)融合等方向。當(dāng)前,其在關(guān)鍵核心技術(shù)上實(shí)現(xiàn)突破,加快高端算力芯片、工業(yè)多模態(tài)算法、軟硬件適配等技術(shù)攻關(guān),加快打造高質(zhì)量數(shù)據(jù)集,持續(xù)筑牢芯片產(chǎn)業(yè)底座。
實(shí)際上,微美全息建立了覆蓋云端和邊緣端的算力基礎(chǔ)設(shè)施,支持多元架構(gòu)的先進(jìn)AI芯片接入,可滿足日常訓(xùn)練與推理的多樣化需求。此外,為加強(qiáng)關(guān)鍵核心技術(shù)突破,持續(xù)推動(dòng)產(chǎn)業(yè)高質(zhì)量發(fā)展,微美全息將一手抓技術(shù)供給,促進(jìn)“智能產(chǎn)業(yè)化”,一手抓賦能應(yīng)用,加快“算力產(chǎn)業(yè)智能化”,推動(dòng)人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展,高水平賦能新型工業(yè)化。
結(jié)語
綜上,AI大模型訓(xùn)練和推理對算力的需求持續(xù)增加,推動(dòng)AI芯片市場擴(kuò)張,能夠滿足AI訓(xùn)練、推理等場景下GPU、ASIC等高算力芯片的用電需求。而對這些科技巨頭而言,自研AI芯片不僅是為了省錢,更是為了在未來的AI競爭中構(gòu)筑核心技術(shù)壁壘。當(dāng)模型和算法的差距日益縮小時(shí),底層硬件的效率和成本將成為決定勝負(fù)的關(guān)鍵手,在不遠(yuǎn)的將來,將讓它們擁有更大的自由度和想象空間。