全自研芯片計(jì)算!百度智能云Qianfan
作者:娛樂(lè) 來(lái)源:探索 瀏覽: 【大 中 小】 發(fā)布時(shí)間:2025-09-23 14:32:41 評(píng)論數(shù):
9月22日消息,全自今日,研芯百度智能云千帆正式推出全新視覺(jué)理解模型——Qianfan-VL,片計(jì)并全面開(kāi)源。算百
即日起至10月10日,度智用戶可在百度智能云千帆平臺(tái)免費(fèi)體驗(yàn)8B、全自70B模型。研芯
據(jù)介紹,片計(jì)Qianfan-VL系列模型包含3B、算百8B和70B三個(gè)尺寸版本,度智是全自面向企業(yè)級(jí)多模態(tài)應(yīng)用場(chǎng)景,進(jìn)行了深度優(yōu)化的研芯視覺(jué)理解大模型。
Qianfan-VL不僅具備出色的片計(jì)基礎(chǔ)通用能力,還針對(duì)產(chǎn)業(yè)落地中的算百高頻需求,如OCR和教育垂直場(chǎng)景做了專(zhuān)項(xiàng)強(qiáng)化。度智
據(jù)悉,該系列模型基于開(kāi)源模型進(jìn)行開(kāi)發(fā),并在百度自研昆侖芯 P800上完成全流程計(jì)算任務(wù),其提供了強(qiáng)大的算力支撐,同時(shí)支持單任務(wù)5000卡規(guī)模的并行計(jì)算。
這一結(jié)合不僅優(yōu)化了模型計(jì)算的效率,更使得模型在性能表現(xiàn)上達(dá)到了新的高度,在通用和垂類(lèi)任務(wù)評(píng)測(cè)中展現(xiàn)出SOTA水平。
Qianfan-VL模型具備三大特點(diǎn):
多尺寸模型滿足不同場(chǎng)景需求:提供3B、8B、70B三種規(guī)格的模型,讓不同規(guī)模的企業(yè)和開(kāi)發(fā)者都能找到合適的解決方案。
提供思考推理能力:8B和70B模型支持通過(guò)特殊token激活思維鏈能力,覆蓋復(fù)雜圖表理解、視覺(jué)推理、數(shù)學(xué)解題等多種場(chǎng)景。
OCR與文檔理解能力增強(qiáng):主打OCR全場(chǎng)景識(shí)別和復(fù)雜版面文檔理解兩大特色能力,在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為企業(yè)級(jí)應(yīng)用提供高精度的視覺(jué)理解解決方案。
在通用能力基準(zhǔn)測(cè)試中,Qianfan-VL系列模型(3B、8B、70B)展現(xiàn)出顯著核心優(yōu)勢(shì)。
從視覺(jué)理解到專(zhuān)業(yè)領(lǐng)域問(wèn)答,模型性能隨參數(shù)規(guī)模增大提升顯著,體現(xiàn)出很好的Scaling趨勢(shì)。
此外,Qianfan-VL系列模型(3B、8B、70B)在OCR與文檔理解領(lǐng)域盡顯卓越實(shí)力。
一方面,具備OCR全場(chǎng)景識(shí)別能力,能精準(zhǔn)識(shí)別手寫(xiě)體、數(shù)學(xué)公式、自然場(chǎng)景文字,還可對(duì)卡證票據(jù)信息進(jìn)行結(jié)構(gòu)化提取。
另一方面,復(fù)雜版面文檔理解能力突出,可自動(dòng)分析版面元素,精準(zhǔn)解析表格、圖表,實(shí)現(xiàn)文檔智能問(wèn)答與結(jié)構(gòu)化解析。
從基準(zhǔn)測(cè)試表現(xiàn)看,在OCRBench、各類(lèi)專(zhuān)業(yè)測(cè)試中,相較于主流模型,成績(jī)優(yōu)異且隨參數(shù)規(guī)模提升持續(xù)向好。
而8B和70B模型,支持通過(guò)特殊token激活思維鏈能力,能覆蓋復(fù)雜圖表理解、視覺(jué)推理、數(shù)學(xué)解題等多類(lèi)場(chǎng)景。
從數(shù)學(xué)解題基準(zhǔn)測(cè)試表現(xiàn)看,在MathVista-mini、MathVision等多項(xiàng)測(cè)試中,相較于主流模型,成績(jī)優(yōu)異且隨參數(shù)規(guī)模提升持續(xù)向好。
值得注意的是,官方還演示了一些模型應(yīng)用的案例。
如OCR識(shí)別場(chǎng)景:
如數(shù)學(xué)推理場(chǎng)景:
如文檔理解場(chǎng)景:
除上述場(chǎng)景應(yīng)用案例外,Qianfan-VL還可應(yīng)用在圖表分析、視頻理解等場(chǎng)景中,均呈現(xiàn)出卓越的模型效果。
Qianfan-VL系列模型的開(kāi)源,對(duì)百度智能云千帆來(lái)說(shuō),更像是“把模型放進(jìn)真實(shí)生產(chǎn)力場(chǎng)景”的第一小步;未來(lái),百度智能云會(huì)不斷推出全新的產(chǎn)業(yè)級(jí)模型,全方位助力AI技術(shù)在各行業(yè)落地。