亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財經(jīng)媒體
科技·商業(yè)·財經(jīng)

全球復(fù)現(xiàn)DeepSeek熱潮,AI大模型分水嶺已至?

   時間:2025-01-26 14:38 來源:新浪財經(jīng)作者:唐云澤

近日,AI界掀起了一股復(fù)現(xiàn)DeepSeek的熱潮,包括UC伯克利、香港科技大學(xué)以及HuggingFace等知名機(jī)構(gòu)紛紛宣布成功復(fù)現(xiàn)這一模型。DeepSeek以其獨(dú)特的強(qiáng)化學(xué)習(xí)機(jī)制,無需監(jiān)督微調(diào),僅憑30美元的成本便能見證“啊哈時刻”,即模型突然展現(xiàn)出強(qiáng)大的自我驗(yàn)證和搜索能力,這一現(xiàn)象引發(fā)了全球AI界的廣泛關(guān)注。

UC伯克利的博士生潘家怡及其團(tuán)隊(duì)在CountDown游戲中復(fù)現(xiàn)了DeepSeek R1-Zero,并取得了令人矚目的成果。他們通過強(qiáng)化學(xué)習(xí),讓30億參數(shù)的基礎(chǔ)語言模型在游戲中逐步進(jìn)化出自我糾正和搜索的策略。更令人興奮的是,整個過程的成本不足30美元。這一項(xiàng)目被稱為TinyZero,它采用了R1-Zero算法,并驗(yàn)證了基礎(chǔ)語言模型、提示和真實(shí)獎勵信號在強(qiáng)化學(xué)習(xí)中的作用。

港科大的何俊賢教授團(tuán)隊(duì)也成功在70億參數(shù)的模型上復(fù)刻出了DeepSeek-R1-Zero和DeepSeek-R1的訓(xùn)練。他們僅使用了8000個樣本,便讓模型在復(fù)雜的數(shù)學(xué)推理上取得了強(qiáng)勁的結(jié)果。這一成果不僅在AIME、AMC和MATH等基準(zhǔn)測試上取得了高分,還超越了使用更復(fù)雜組件和更多數(shù)據(jù)量的模型。

全球最大開源平臺HuggingFace也宣布將復(fù)刻DeepSeek R1的所有pipeline,并將訓(xùn)練數(shù)據(jù)、訓(xùn)練腳本等全部開源。這一項(xiàng)目被稱為Open R1,發(fā)布僅一天便獲得了大量關(guān)注,星標(biāo)數(shù)超過1900,fork數(shù)達(dá)到142。Hugging Face的這一舉動進(jìn)一步推動了DeepSeek的普及和應(yīng)用。

DeepSeek的成功不僅讓科技大廠感到惶恐,也引發(fā)了業(yè)界的神話效應(yīng)。據(jù)網(wǎng)友截圖顯示,DeepSeek應(yīng)用已經(jīng)在APP Store的“效率”應(yīng)用榜單中擠進(jìn)前三。在Hugging Face平臺上,R1的下載量也直接登頂,其他相關(guān)模型也占據(jù)了熱榜。a16z的合伙人Anjney Midha表示,一夜之間,從斯坦福到MIT,DeepSeek R1已經(jīng)成為美國頂尖高校研究人員的首選模型。

DeepSeek的出現(xiàn)無疑為全球AI大模型的發(fā)展帶來了新的分水嶺。它證明了超強(qiáng)性能的模型不再獨(dú)屬于算力巨頭,而是可以通過開源和強(qiáng)化學(xué)習(xí)的方式,讓每個人都有機(jī)會見證和體驗(yàn)。這一成果不僅震撼了世界,也為中國AI的發(fā)展贏得了更多的關(guān)注和贊譽(yù)。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容