近日,一股復現(xiàn)DeepSeek的熱潮在全球范圍內迅速興起,引發(fā)科技界的廣泛關注。UC伯克利、香港科技大學以及HuggingFace等知名機構紛紛宣布成功復現(xiàn)了這一模型,標志著人工智能領域或許即將邁入一個新的發(fā)展階段。
DeepSeek以其獨特的強化學習路徑而著稱,無需監(jiān)督微調,僅憑強化學習便能讓基礎語言模型展現(xiàn)出強大的自我驗證和搜索能力。這一特性使得DeepSeek成為眾多研究者爭相復現(xiàn)的對象。據(jù)透露,復現(xiàn)DeepSeek的成本極低,僅需約30美元便能親眼見證其“啊哈時刻”——模型在強化學習過程中突然展現(xiàn)出強大推理能力的瞬間。
UC伯克利的博士生潘家怡及其團隊在CountDown游戲中復現(xiàn)了DeepSeek的R1-Zero版本,并取得了令人矚目的成果。他們通過強化學習,讓30億參數(shù)的基礎語言模型逐步進化出自我糾正和搜索的策略,成功解決了游戲中的復雜問題。這一成果不僅驗證了DeepSeek的有效性,也進一步證明了強化學習在推動人工智能發(fā)展方面的巨大潛力。
與此同時,香港科技大學助理教授何俊賢的團隊也在70億參數(shù)的模型上復刻出了DeepSeek-R1-Zero和DeepSeek-R1的訓練過程。他們僅使用了8000個樣本,便讓模型在復雜的數(shù)學推理上取得了強勁的表現(xiàn)。這一成果不僅超越了基礎模型的性能,還與使用大量數(shù)據(jù)和復雜組件的其他模型相媲美。
全球最大的開源平臺HuggingFace也宣布將復刻DeepSeek的R1所有pipeline。他們表示,復刻完成后,所有的訓練數(shù)據(jù)、訓練腳本等都將全部開源。這一舉措無疑將進一步推動DeepSeek技術的普及和發(fā)展。
DeepSeek的成功復現(xiàn),不僅讓科技大廠們感受到了前所未有的壓力,也讓全球人工智能的中心轉移問題再次成為熱議話題。有觀點認為,DeepSeek的出現(xiàn)標志著美國AI霸權的動搖,全球AI大模型的競爭將不再局限于算力戰(zhàn),而是更加注重算法和技術的創(chuàng)新。
DeepSeek的復現(xiàn)也引發(fā)了對人工智能未來發(fā)展的廣泛討論。有人認為,隨著技術的不斷進步和成本的降低,超強性能的模型將不再獨屬于算力巨頭,而是屬于每個人。這一觀點無疑為人工智能的普及和發(fā)展帶來了更多的可能性和希望。