在瑞士達沃斯舉行的世界經(jīng)濟論壇上,微軟首席執(zhí)行官薩提亞·納德拉對一項源自中國的AI技術(shù)表達了高度贊賞。他特別提到了DeepSeek的新模型,稱贊其在高效開發(fā)開源模型及推理計算方面的卓越表現(xiàn),并強調(diào)這些技術(shù)進展不容忽視。
DeepSeek-R1近期在大模型競技榜上取得了顯著成績,與ChatGPT-4o(發(fā)布于2024年11月20日)并列前三,而其開源且成本僅為后者的二十分之一的特點尤為引人注目。此前已有消息透露,F(xiàn)acebook母公司meta成立了四個專項研究小組,致力于解析DeepSeek的工作原理,并期望借此改進其旗下的大模型Llama。
DeepSeek-R1推理大模型于1月20日正式發(fā)布,據(jù)官方介紹,該模型在后訓(xùn)練階段大規(guī)模應(yīng)用了強化學(xué)習(xí)技術(shù),即便在標(biāo)注數(shù)據(jù)極少的情況下,也顯著提升了模型的推理能力。在數(shù)學(xué)、代碼編寫以及自然語言推理等多項任務(wù)上,DeepSeek-R1的性能與OpenAI的o1正式版不相上下。
更令人矚目的是,Deepseek應(yīng)用在發(fā)布后不久便迅速攀升至蘋果中國及美國地區(qū)應(yīng)用商店免費App下載排行榜的榜首位置,甚至在美國市場的下載榜上超越了ChatGPT,展現(xiàn)了其強大的市場吸引力和用戶基礎(chǔ)。