新浪科技訊 7月28日下午消息,螞蟻世界人工智能大會論壇上,數(shù)科螞蟻數(shù)科正式發(fā)布金融推理大模型Agentar-Fin-R1,發(fā)布為金融AI應(yīng)用打造“可靠、金融可控、推理可優(yōu)化”的大模智能中樞。Agentar-Fin-R1基于Qwen3研發(fā),螞蟻在FinEval1.0、數(shù)科FinanceIQ等權(quán)威金融大模型評測基準(zhǔn)上超越Deepseek-R1等同尺寸開源通用大模型以及金融大模型,發(fā)布顯示其更強的金融金融專業(yè)性、推理能力以及安全合規(guī)能力。推理
隨著金融業(yè)數(shù)智化轉(zhuǎn)型不斷提速,大模大模型在金融領(lǐng)域的螞蟻應(yīng)用正持續(xù)深化,然而在實際業(yè)務(wù)場景中,數(shù)科往往需要高度專業(yè)的發(fā)布金融知識、復(fù)雜的業(yè)務(wù)邏輯推理能力以及嚴(yán)格的金融級安全合規(guī)等要求,現(xiàn)有的大模型在解決實際金融任務(wù)時仍然存在諸多挑戰(zhàn)。
“通用大模型距離產(chǎn)業(yè)實際應(yīng)用存在‘知識鴻溝’。構(gòu)建專業(yè)的金融大模型是推進金融與AI深度融合的必然路徑,未來,金融大模型的應(yīng)用深度將成為金融機構(gòu)競爭力的關(guān)鍵要素?!蔽浵仈?shù)科CEO趙聞飆在演講中表示。
據(jù)悉,螞蟻數(shù)科通過構(gòu)建全面的金融任務(wù)數(shù)據(jù)體系以及模型訓(xùn)練算法創(chuàng)新,實現(xiàn)模型更強的金融推理能力及可信性。評測結(jié)果顯示:相較于通用開源模型及其他金融模型,Agentar-Fin-R1在FinEval1.0、FinanceIQ兩大主流金融基準(zhǔn)測試中均取得最高評分。并且模型在金融能力顯著增強的同時,通用能力也表現(xiàn)出較高水準(zhǔn)。
在數(shù)據(jù)層面,螞蟻數(shù)科構(gòu)建了業(yè)內(nèi)最全面與專業(yè)的金融任務(wù)分類體系,包括6大類、66小類場景,覆蓋銀行、證券、保險、基金、信托等金融全場景。基于千億級金融專業(yè)數(shù)據(jù)語料,通過可信數(shù)據(jù)合成技術(shù)以及結(jié)合專家標(biāo)注的金融長思維鏈(CoT)構(gòu)造機制,顯著提升模型處理復(fù)雜任務(wù)的能力,讓大模型“天生懂金融,出廠即專家”。
在訓(xùn)練層面,創(chuàng)新的加權(quán)訓(xùn)練算法,提高大模型對復(fù)雜金融任務(wù)學(xué)習(xí)效率與性能。在后續(xù)業(yè)務(wù)應(yīng)用中,可顯著減少二次微調(diào)的數(shù)據(jù)需求與算力消耗,有效降低大模型在企業(yè)落地的門檻與成本。此外,Agentar-Fin-R1還能不斷更新迭代,吸收最新的金融政策、市場動態(tài)等關(guān)鍵信息,并通過配套評測工具進行針對性優(yōu)化,讓模型能力在真實業(yè)務(wù)場景中不斷進化。
據(jù)悉,Agentar-Fin-R1包括32B和8B參數(shù)兩個版本。螞蟻數(shù)科還推出基于百靈大模型的MOE架構(gòu)模型,獲得更優(yōu)推理速度。此外,還有非推理版本的14B和72B參數(shù)大模型,以滿足金融機構(gòu)在多樣化場景下的部署需求。

責(zé)任編輯:李鐵民