新浪科技訊 7月29日晚間消息,發(fā)布今日閉幕的應(yīng)用2025世界人工智能大會(展覽)上,GMI Cloud 發(fā)布自研“ AI 應(yīng)用構(gòu)建成本計算器”,構(gòu)建宣布通過實時量化不同場景下的成本T成算力成本、時間損耗與供應(yīng)商性價比,計算可為開發(fā)者提供成本規(guī)劃支持。器宣
典型場景評估顯示,布降本超使用 GMI Cloud 方案可使海外 IT 成本降低 40% 以上,低海回本周期縮短至行業(yè)平均水平的發(fā)布 1/3。
Token作為AI文本處理的應(yīng)用基本單位,其消耗成本直接決定商業(yè)可行性。構(gòu)建據(jù)行業(yè)數(shù)據(jù)顯示,成本T成GPT-4 Turbo處理單次多步驟Agent任務(wù)消耗可達(dá)200萬Token(成本約2美元),計算而工程化部署周期普遍被低估60%。器宣
據(jù)介紹,布降本超GMI Cloud “ AI 應(yīng)用構(gòu)建成本計算器”可基于Token數(shù)量與單價(區(qū)分輸入 / 輸出), 核算AI應(yīng)用/AI Agent 構(gòu)建總花費;結(jié)合Token吞吐量(輸入 / 輸出速度),計算處理總請求的耗時。同時,該工具還能實時對比OpenAI、Anthropic等15家供應(yīng)商的Token單價,自動標(biāo)記Inference Engine等低成本替代方案。
此外,GMI Cloud Inference Engine 的底層調(diào)用GMI Cloud 全棧能力,可直接調(diào)用英偉達(dá) H200、B200芯片,從硬件到軟件進(jìn)行了端到端的優(yōu)化,極致優(yōu)化單位時間內(nèi)的Token吞吐量,確保其具備最佳的推理性能以及最低的成本,最大限度地幫助客戶提升大規(guī)模工作時的負(fù)載速度以及帶寬。同時,其讓企業(yè)以及用戶進(jìn)行快速部署,選擇好模型后即刻擴展,幾分鐘之后就可以啟動模型,并用這個模型進(jìn)行 Serving。(文猛)
海量資訊、精準(zhǔn)解讀,盡在新浪財經(jīng)APP
責(zé)任編輯:何俊熹
頂: 4893踩: 9828
GMI Cloud 發(fā)布“ AI 應(yīng)用構(gòu)建成本計算器”,宣布降低海外 IT 成本超40%
人參與 | 時間:2025-09-23 16:44:02
評論專區(qū)
相關(guān)文章
- Windows 11任務(wù)欄將增加AI功能!微軟正測試“任務(wù)欄伴侶”
- 阿維塔與中東經(jīng)銷商ASG集團達(dá)成合作,共同開拓科威特市場
- 蔚來宣布完成10億美元股權(quán)增發(fā)融資
- 螞蟻集團CEO韓歆毅:AI時代中國移動支付正邁入新一輪創(chuàng)新周期
- 臺積電3nm漲價20% 天璣9500、驍龍8E5成本更貴了:明年更慘
- 羅永浩:華與華老板已跟我道歉,這件事可以過去了
- 知乎啟動2025科學(xué)季 韓濟生、龐國芳、勵建安三位院士領(lǐng)銜創(chuàng)作
- 菜鳥CEO萬霖:AI推動端到端無人化成為可能
- 羅永浩深夜發(fā)聲:要和團隊把大部分預(yù)制菜測試一遍
- 高德發(fā)布“高德掃街榜”,將發(fā)放超10億補貼支持煙火好店