滾動資訊

當(dāng)前位置：網(wǎng)界 > 行業(yè)動態(tài) > 正文內(nèi)容

DeepSeek國產(chǎn)AI崛起，憑何實力挑戰(zhàn)美國科技巨頭？

時間：2025-02-05 20:41 來源：德波作者：顧雨柔

在辭舊迎新的時刻，科技界也迎來了一場震撼人心的變革。一個名為DeepSeek的中國AI初創(chuàng)公司，以其最新發(fā)布的大模型DeepSeek-R1，在全球范圍內(nèi)掀起了軒然大波，成為了新年里科技領(lǐng)域最耀眼的新星。

DeepSeek此前就曾因其V3模型在硅谷引起轟動，但此次R1的發(fā)布，無疑是將這場風(fēng)暴推向了新的高潮。meta的聯(lián)合創(chuàng)始人對DeepSeek-R1贊不絕口，甚至不惜與批評者展開唇槍舌劍，足見其對這一技術(shù)的震撼程度。風(fēng)投大佬馬克·安德森也對DeepSeek-R1給予了高度評價，稱其為對世界的一份深刻饋贈。

DeepSeek-R1的出色表現(xiàn)，迅速贏得了廣大網(wǎng)友的青睞。許多原本使用ChatGPT的用戶，紛紛轉(zhuǎn)而投向DeepSeek的懷抱。DeepSeek的應(yīng)用商店排名也因此飆升，一舉登上了APPSTORE的榜首。

在國內(nèi)，DeepSeek同樣引發(fā)了巨大的反響。微博上與之相關(guān)的熱搜話題不斷，甚至一些非AI行業(yè)的圈外人也對其表現(xiàn)出了濃厚的興趣。游戲開發(fā)者馮驥就在微博上感慨，DeepSeek的成就堪稱“國運級別的科技成果”。

DeepSeek的成功并非偶然。據(jù)暗涌對DeepSeek創(chuàng)始人梁文鋒的采訪透露，DeepSeek是一個極其注重創(chuàng)新的公司。其V2、V3模型中的多頭注意力機制，最初只是團隊內(nèi)一位年輕開發(fā)者的創(chuàng)意，經(jīng)過團隊的共同努力才得以實現(xiàn)。而這種創(chuàng)新驅(qū)動的技術(shù)突破，在DeepSeek團隊內(nèi)并不罕見。

然而，DeepSeek-R1的真正牛氣之處，在于其路徑創(chuàng)新。傳統(tǒng)大模型訓(xùn)練注重標(biāo)注數(shù)據(jù)微調(diào)（SFT）和強化學(xué)習(xí)（RL），但DeepSeek卻摒棄了SFT，完全依靠強化學(xué)習(xí)來訓(xùn)練其推理模型。這種高強度的淬煉方式，使得DeepSeek-R1在僅花費600萬美元、兩個月時間的情況下，就達到了其他大廠花費數(shù)億資金、數(shù)年時間才能達到的水平。

DeepSeek團隊的研究人員還利用這種思路，在V3的基礎(chǔ)上完全靠強化學(xué)習(xí)搞出了一個R1-Zero版本。Zero版本在訓(xùn)練中進化速度極快，很快就能與OpenAI-o1相抗衡，甚至在部分測試項目中還超越了o1。Zero不僅在推理能力上取得了顯著進步，還表現(xiàn)出了主動復(fù)盤反思糾錯的行為，這無疑是AI推理上的里程碑事件。

雖然Zero的推理能力已經(jīng)得到了證明，但其輸出的可讀性較差，不符合人類預(yù)期。于是DeepSeek團隊在Zero的基礎(chǔ)上增加了一部分SFT訓(xùn)練，使得模型學(xué)會了說人話，從而誕生了DeepSeek-R1。經(jīng)過這番“文理雙修”后，R1的推理能力甚至進一步提高，在數(shù)學(xué)、代碼和綜合知識測試中均取得了優(yōu)異成績。

更為驚人的是，DeepSeek團隊還將R1的SFT數(shù)據(jù)蒸餾后喂給其他小模型進行SFT，結(jié)果這些小模型的性能也得到了顯著提升。這一發(fā)現(xiàn)不僅驗證了“小模型，好老師”的技術(shù)路線，更讓個人開發(fā)者也能調(diào)教出匹敵GPT-4的AI。這一成果無疑為全球開源社區(qū)帶來了巨大的鼓舞和啟示。

DeepSeek的成功，不僅證明了開源模型的實力，更向世界展示了中國年輕人的潛力和開創(chuàng)精神。正如梁文鋒所說：“中國AI不可能永遠處在跟隨的位置?！盌eepSeek的崛起，無疑為中國AI行業(yè)的發(fā)展注入了新的活力和信心。

更多>同類內(nèi)容

紅利指數(shù)今日下跌，高股息低波動策略投資價值幾何？

02-05

《哪吒之魔童鬧海》工作日票房奪冠，總票房突破54億刷新紀(jì)錄！

02-05

哪吒系列總票房破百億，哪吒2能否再創(chuàng)國產(chǎn)片票房新高？

02-05

華為DeepSeek系列模型登陸昇騰社區(qū)，一鍵獲取體驗AI新高度！

02-05

電影票里的服務(wù)費，到底誰在悄悄賺錢？

02-05

張雪峰教育科技公司新晉蘇州永鑫開拓二號股權(quán)投資合伙人

02-05

滬深兩市成交額破萬億，超3400股開門紅，A500ETF等產(chǎn)品如何助力投資？

02-05

“20cm股”漲停潮來襲！熱門概念股頻現(xiàn)，市場熱度再升溫？

02-05

2024中國互聯(lián)網(wǎng)保險新風(fēng)向：未來市場展望與五大趨勢預(yù)判

02-05

阿里吸納AI頂尖人才，新加坡管理大學(xué)許主洪教授強勢加盟！

02-05

國產(chǎn)寶馬X3新升級，軸距趕超X5，配置曝光選裝多樣！

02-05

小紅書2024搜索趨勢：生活化精細(xì)化需求引領(lǐng)新風(fēng)尚

02-05

“我店模式”揭秘：綠色積分如何助力商家引流增收？

02-05

哪吒兩部曲破百億，三歲“演員”成就電影史新傳奇！

02-05

寧德時代或于本月及下月初提交港股上市申請，募資額超360億

02-05

點擊查看更多 +

全站最新

白銀多頭蓄勢待發(fā)，能否一舉突破31.70-31.75美元關(guān)鍵阻力？

AI新星DeepSeek崛起，哈佛教授嘆美國錯失“錢學(xué)森級”人才

紅利指數(shù)今日下跌，高股息低波動策略投資價值幾何？

春節(jié)消費火熱！日均銷售收入漲超10%，消費ETF如何布局核心資產(chǎn)？

雷軍官宣：小米雙Ultra月底來襲，SU7 Ultra提前發(fā)布有何新驚喜？