您現在的位置是:焦點 >>正文
騰訊云李力:堅持同源同構 為企業打造更貼近Agent的AI原生云
焦點1人已圍觀
簡介9月17日,在2025年騰訊全球數字生態大會Agent+Infra專場,騰訊云副總裁李力宣布騰訊云智算全面升級。騰訊云智算面向“更貼近Agent的AI Infra”建立包括Ag ...
9月17日,騰訊在2025年騰訊全球數字生態大會Agent+Infra專場,云李源同I原騰訊云副總裁李力宣布騰訊云智算全面升級。力堅騰訊云智算面向“更貼近Agent的持同AI Infra”建立包括Agent Infra解決方案Agent Runtime+云專家服務智能體Cloud Mate與全鏈路安全能力為一體的完整解決方案,幫助Agentic AI 從“實驗室”走向“生產級”。構為更貼
李力表示,企業“同源同構”是打造的貫穿騰訊云產品設計與服務能力的核心原則,也是騰訊其應對行業需求、面對技術變革、云李源同I原支撐全球化布局的力堅關鍵邏輯。這一原則包含雙重核心內涵:一方面,持同以一致的構為更貼代碼體系、服務標準與產品特性,企業同步服務騰訊微信、打造的QQ、騰訊游戲等自研業務與外部客戶,通過“自用自驗”提前解決技術痛點,向行業客戶交付成熟的技術與服務;另一方面,實現公有云、專有云、邊緣計算、分布式云及國內外服務的能力統一,即便海外開區,機房標準與功能體驗也與國內完全一致,保障全球化服務的一致性。
這一云計算時代堅守的原則,在智算領域展現出更大的價值:例如在存儲層面,騰訊云憑借十年來打磨的CBS、CFS等存儲產品,即可完美匹配AI對存儲的性能需求,而無需推導重構一套適配于智算時代的存儲底座。可以說,智算的興起進一步凸顯AI原生云的優勢。李力強調,“同源同構”是騰訊云IaaS體系的核心調性,它不僅是產品技術層面的標準,更是騰訊云在AI Agent時代為客戶提供穩定服務、支撐全球化拓展的底層邏輯,也為客戶降低跨場景、跨區域的技術適配成本。
他認為,與AI時代相比,Agent時代對Infra的需求出現了全新的變化。未來兩年,部署AI Agent的企業數量將翻番,相關支出增幅將達到192%。按照行業慣例,云基礎設施的建設支出,將會比AI Agent的支出更大。大量企業將會提前投資、儲備云基礎設施,已適配業務需求的重大變化。但部分企業倉促落地的智算中心,往往采購大量高端硬件設備,但卻因為配套設施(存儲、網絡、安全、運維等)建設上的之后,陷入閑置風險。這不僅導致成本與時間的巨大消耗,也會導致錯失關鍵市場窗口期。
要解決這個現狀,就需要注意到AI Agent時代對Infra提出的新要求。一是更快的模型推理效率。這意味著除了提供“又快又穩”的底層能力之外,Infra還需要具備更貼近業務、從底層“向上”輻射的價值。為了讓模型推理更快,可以基于云的角度去做一些探索,在Infra底層技術和工程創新上幫助AI落地更加順暢。二是更靈活的工具集成。實際上在部署和運行Agent的過程中,Agent本身就是一個工具,能調用哪些工具,是否好用也沒有明確的目標。但最終的目的,是像人的手腳一樣,能夠形成工具的集合,在一個工具自動運行的時候,其他工具能夠協同輔助,讓Agent延展的更廣,得以體現它的智能優勢。三是穩定的系統保障。在通用計算場景下,業務和底座是分離的。但到了智算時代推理階段,模型和業務天然綁定在一起。假設企業的核心業務已經在云上跑,要把它遷移到智算平臺,那就會對存儲、網絡、中間件提出巨大挑戰,對平臺的系統保障提出了非常高的要求。
針對智算時代的新需求、新挑戰,騰訊云智算提出要成為“更貼近Agent的智能引擎”。它包括AI Infra靈活底座+AI Infra多元硬件、AIinfra高性能軟件,以及全新升級發布的Agent Infra解決方案“Aggent Runtime”、云專家服務智能體“Cloud Mate”以及全鏈路安全能力。
在底座上,騰訊云智算持續進行優化提升,成為更貼近Agent的AI原生云。在硬件層面,支持一云多芯、軟硬協同,支持多樣硬件生態,支持自研及第三方交換機;在軟件層面,提供大語言模型加速(TACO-LLM推理效率提升100~130%)、文生圖模型加速(TACO-DIT推理效率提升122%)、推理集群即服務(HAI分鐘級拉起滿血模型,高緩存命中)等核心升級。他舉例說,基礎設施的升級能夠顯著影響客戶體驗。例如在游戲場景頻繁擴縮容、或者終端廠商提供模型服務切換底層模型的場景,都高度依賴云平臺的擴縮容速度。而騰訊云歷史上沉淀的創建速度快的優勢,在智算時代繼續成為了客戶認可的稟賦。
在模型推理層面,騰訊云智算高性能軟件的升級,能夠助力推理集群性能發揮到極致。一方面,實現模型啟動效率的飛躍——依托HML去中心化加速模型拉取、RDMA高速網絡與GooseFS等,大規模擴容場景下整體服務拉起時間從10分鐘大幅壓縮至34秒,模型啟動速度提升17倍,讓AI服務能像消費電子設備般“即開即響應”;另一方面,在多模態推理加速上實現突破:騰訊自研的TACOKit推理加速引擎,通過文生圖并行化處理等技術,使生文、生圖、生視頻模型,在大部分場景下性能提升4倍以上,有力支撐客戶海量圖像生產、快速創意迭代的需求。借助全局共享KV緩存、TRMT通訊協議、PD分離部署、模型量化等底層技術優化,客戶無需額外適配,就能獲得極致推理速度,大幅降低AI推理能力落地的技術門檻。
在工具集成層面,騰訊云智算全新發布Agent Runtime云沙箱,為Agent提供安全隔離的執行環境。Agent Runtime脫胎于騰訊云原生已有的體系,實現Infra服務的極致無縫化。它能快速創建運行環境,支撐大規模Agent應用落地;它將基建運維做到“極致無感”,用戶無需關注底層資源調度邏輯,計算資源會按需“憑空出現”,完成任務后自動釋放,全程無需手動開關機或配置環境。
在系統守護方面,騰訊云智算發布Cloud Mate云專家服務智能體,基礎設施向主動服務躍進。李力說,AI讓Infra變得更智能,更可靠,具備“主動服務”的特性。Cloud Mate 云專家服務智能體以實時監控、操作審計、資源配置、日志等基礎能力為底座,結合預測與診斷模型,再通過自動化執行工具,構建起“源頭風險預防-運營風險規避-智能運維”的全鏈路主動服務能力。一方面,能對云環境中SQL性能瓶頸、潛在安全漏洞等進行智能預判與精準診斷提前攔截高峰擴容等場景下的隱性風險;另一方面,借助AI從海量日志中自發挖掘潛在問題并推動專家響應,讓海量服務器與算力資源的管理更可控、更智能。在實踐中,Cloud Mate已經能夠實現3分鐘快速診斷,準確率超過95%。
機器人正在成為AI發展落地的重要方向,但具身智能也面臨著顯著挑戰。一方面,具身智能缺乏大語言模型所具備的天然、開放、海量的數據,而具身數據和硬件高度綁定,對數據質量的要求極高;另一方面具身智能依賴的多模態感知,需要整合圖像、文字、聲音甚至觸感等多元信息,實現綜合交互的作用。騰訊依云通過HAI推理集群聯合自研具身智能產品Tairos,提供具身感知與規劃模型服務,以“多模態、全托管、獨享算力、安全穩定”為核心特性,為機械臂、人形機器人等設備打造專屬、跨本體的“云上大腦”。
李力介紹說,騰訊云智算還在通過一些基于AI的特性解決開發領域中的一些難題。推出OrcaTerm AI原生智能終端,以AI整合服務器環境信息為核心,支持腳本生成、應用部署、業務排障等全流程操作,讓服務器“帶內”操作如自然對話般簡單。這個探索產品上線后,很快就實現了數萬日活、用戶平均停留數個小時的好成績。在輕量云服務器等產品探索AI化服務,解決傳統海量文檔對用戶的過度消耗。
李力表示,目前,騰訊云智算已經服務了國內90%的大模型廠商,并為交通出行、工業制造、教育培訓、具身智能、醫療健康、金融保險等千行百業提供了高效、好用的云智算解決方案。騰訊云希望,通過Infra讓AI變得更好,也通過AI讓Infra變得更好。
Tags:
相關文章
讓小眾車賣爆!余承東:享界S9T上市一周大定超1.3萬臺
焦點9月23日消息,旅行車在國內一直是個小眾車,尤其是行政旅行車,此前也只有BBA三兄弟以及沃爾沃愿意涉足,好消息是,有中國選手出場了。上周,享界S9T上市,30.98萬的起售價著實很有性價比,在正在進行 ...
【焦點】
閱讀更多2025英雄聯盟職業聯賽總決賽BLG捧杯 Knight實現個人五連冠
焦點中新網北京9月22日電(記者 王昊)21日,英雄聯盟職業聯賽2025賽季總決賽在深圳大運中心體育館落下帷幕,以不敗戰績一路挺進決賽的BLG戰隊,再戰從敗者組歸來的TES戰隊。最終,BLG以3:2擊敗T ...
【焦點】
閱讀更多一年賣出10個億 這是年輕人真正的戶外神器
焦點一個多月前,當我拿到影石新一代口袋相機 Insat360 GO Ultra 的時候,我身邊幾乎所有人都會問我一個同樣的問題:到底是在買這個品類?誰會需要一臺口袋相機?他們有的會拿口袋相機和運動相機做對 ...
【焦點】
閱讀更多