陳天橋MiroMind團隊連續(xù)登頂FutureX,超越國際領先預測大模型


新浪科技訊 9月22日下午消息,陳天超據(jù)動態(tài)實時LLM智能體未來預測基準FutureX最新評測結(jié)果,隊連頂F大模慈善家陳天橋創(chuàng)立的續(xù)登型AI公司MiroMind團隊搭載GPT-5的MiroFlow智能體框架,已在9月第1周和第2周連續(xù)奪得榜首,國際超越眾多國際頂尖機構(gòu)和閉源商業(yè)模型。領先
據(jù)悉,預測與專注文本輸出的陳天超生成式模型不同,MiroMind采用記憶驅(qū)動機制,隊連頂F大模專為預測與決策設計,續(xù)登型旨在打造全球最好的國際預測大模型。在測試中,領先MiroMind成功預測了2025年9月9日ATP男子單打排名第4-6位的預測選手,同時還成功預測了2025年9月11日數(shù)字加密貨幣Solana將突破的陳天超一系列關鍵價格檔位,體現(xiàn)了模型在處理價格波動類問題上的隊連頂F大模系統(tǒng)建模能力與風險控制水平。
MiroMind的續(xù)登型登頂并非偶然,而是基于AI預測未來的幾項核心能力:第一,信息洞察力:能快速抓取、理解和整合海量數(shù)據(jù);第二,邏輯推理與趨勢感知:能發(fā)現(xiàn)模式、識別因果、判斷趨勢。第三,概率與不確定性管理:能量化可能性、權(quán)衡風險,在不確定環(huán)境下做出最優(yōu)判斷。第四,跨領域整合能力:能把金融、政治、科技、社會等多領域信息融會貫通。
在GAIA-Validation上,MiroFlow框架也取得了82.4%的出色成績,并在HLE、BrowseComp以及xBench-DeepSearch等基準測試中領先眾多國際對手。目前,MiroFlow已對外提供了完全開源、可復現(xiàn)的框架和配置。
Future X由字節(jié)跳動SEED團隊聯(lián)合斯坦福大學、復旦大學等推出,是全球首個動態(tài)實時LLM智能體未來預測基準。它從全球200多個高質(zhì)量網(wǎng)站精選只有下周才會有明確結(jié)果的問題,讓AI直面真正的未來事件:股票價格的漲跌、體育比賽的勝負、政治選舉的結(jié)果、科技公司的戰(zhàn)略走向等。(文猛)

責任編輯:何俊熹
相關文章
- 下面這張照片實在是太經(jīng)典了,原來世界上有一種鳥能長得這么可愛的:這是一只冬季的北長尾山雀,它在飛行過程中收起翅膀向下俯沖時被抓拍了,這一瞬間將它的可愛體現(xiàn)得淋漓盡致,給攝影師點個贊。圖片:北川譲圖片:2025-09-23
- 2025年9月11日至12日,大疆運載于四川甘孜藏族自治州瀘定縣成功舉辦了“甘孜天路——大疆運載無界之旅”深度媒體交流活動。本次活動邀請無人機政策專家、2025-09-23
- 9月15日消息,今日下午,魅族22旗艦手機暨Flyme AlOS生態(tài)發(fā)布會上,星紀魅族中國區(qū)CMO萬志強發(fā)表演講。萬志強分享了星紀魅族在手機、車機、智能眼鏡方面的進展。他表示:“今年6182025-09-23
新能源汽車品牌TOP15年銷量目標完成情況一覽:小米62%排第三
9月15日消息,在新能源汽車市場的激烈角逐中,各品牌的年銷量目標完成情況備受關注。汽車博主“痛快舒暢”今天公布了截至目前,國內(nèi)TOP15新能源汽車品牌2025年銷量目標完成情況2025-09-23HEYONE黑玩發(fā)布全新視覺系統(tǒng) 獲行業(yè)廣泛好評
2025年9月17日,國內(nèi)知名原創(chuàng)IP潮玩品牌HEYONE黑玩通過其官方社交平臺,正式發(fā)布品牌全新視覺體系。此次升級涵蓋全新LOGO、品牌主視覺圖標ICON)及標準色系統(tǒng)優(yōu)化,顯著提升了品牌識別度與視2025-09-23格力創(chuàng)新家電亮相央視中國品質(zhì)生活晚會 鮮花冰箱等京東熱銷中
9月15日,“中國品質(zhì)生活”晚會在中央廣播電視總臺央視財經(jīng)頻道播出。晚會以“高質(zhì)量中國經(jīng)濟高品質(zhì)消費生活”為主題,通過生動案例和多部委的權(quán)威解讀,展現(xiàn)中2025-09-23