9月18日消息,打破據(jù)媒體報(bào)道,蒸餾質(zhì)疑由DeepSeek團(tuán)隊(duì)共同完成、梁文梁文鋒擔(dān)任通訊作者的鋒論DeepSeek-R1推理模型研究論文,近日登上國際頂級學(xué)術(shù)期刊《自然》(Nature)的文登封面,引發(fā)廣泛關(guān)注。上自
與今年1月發(fā)布的然封初版論文相比,本次正式發(fā)表的打破版本披露了更多模型訓(xùn)練的技術(shù)細(xì)節(jié),并對發(fā)布初期外界有關(guān)“蒸餾”方法的蒸餾質(zhì)疑質(zhì)疑作出了正面回應(yīng)。
DeepSeek-R1也因此成為全球首個(gè)經(jīng)過嚴(yán)格同行評審的梁文主流大語言模型。《自然》在評論中指出,鋒論當(dāng)前絕大多數(shù)主流大模型尚未經(jīng)過獨(dú)立的文登同行評審,而這一重要空白“終于被DeepSeek打破”。上自
公開資料顯示,然封DeepSeek創(chuàng)始人梁文鋒畢業(yè)于浙江大學(xué)電子信息與通信工程專業(yè),打破獲本科及碩士學(xué)位。他于2023年7月創(chuàng)立DeepSeek,公司在2024年5月推出DeepSeek-V2,同年12月27日發(fā)布DeepSeek-V3。
2025年1月20日,DeepSeek正式發(fā)布DeepSeek-R1模型。該模型猶如一顆投入平靜湖面的巨石,在國際AI界激起千層浪,不僅顛覆了“AI研發(fā)必須高投入、長周期”的傳統(tǒng)認(rèn)知,也打破了美國在AI領(lǐng)域的話語壟斷。