近期,一款名為Deepseek的AI聊天機(jī)器人在全球范圍內(nèi)引發(fā)了廣泛關(guān)注。這款源自中國(guó)的產(chǎn)品,不僅在本土市場(chǎng)表現(xiàn)搶眼,還成功超越了谷歌的Gemini,躍居全球AI聊天機(jī)器人受歡迎程度排行榜的第二位。
特斯拉CEO埃隆·馬斯克在最近的一次采訪(fǎng)中,對(duì)中國(guó)工程師表示了高度贊賞。他指出,中國(guó)擁有眾多才華橫溢且充滿(mǎn)進(jìn)取心的工程師,因此中國(guó)能夠創(chuàng)造出眾多偉大的科技成果,Deepseek便是其中之一。馬斯克認(rèn)為,這充分展示了中國(guó)人才輩出的現(xiàn)狀。
然而,盡管對(duì)Deepseek給予了一定的肯定,馬斯克卻并未將其視為AI領(lǐng)域的一次革命性突破。他相信,包括他旗下AI公司在內(nèi)的眾多AI企業(yè),很快將推出比Deepseek更出色的模型。
谷歌DeepMind的首席執(zhí)行官、2024年諾貝爾化學(xué)獎(jiǎng)得主德米斯·哈薩比斯也對(duì)Deepseek發(fā)表了看法。他稱(chēng)贊Deepseek的AI模型可能是他所見(jiàn)過(guò)的中國(guó)最佳作品之一,但同時(shí)也指出,從技術(shù)層面來(lái)看,Deepseek并未帶來(lái)重大的科學(xué)進(jìn)展,而是利用了已知的人工智能技術(shù)。哈薩比斯還表示,谷歌最新發(fā)布的Gemini 2.0 Flash模型在效率上超過(guò)了Deepseek。
Deepseek自2023年5月成立以來(lái),憑借其極低的成本和出色的性能,迅速吸引了市場(chǎng)的廣泛關(guān)注。其背后的支持者是國(guó)內(nèi)對(duì)沖基金巨頭幻方量化。2024年5月,Deepseek發(fā)布了開(kāi)源的第二代MoE大模型DeepSeek-V2,該模型在性能上與GPT-4 Turbo相當(dāng),但價(jià)格卻僅為GPT-4的百分之一。因此,Deepseek被業(yè)界戲稱(chēng)為“價(jià)格屠夫”和“AI界的拼多多”。
2025年1月,Deepseek推出的R1模型在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上展現(xiàn)出了與OpenAI的o1-1217模型相當(dāng)?shù)膶?shí)力,并在美國(guó)數(shù)學(xué)邀請(qǐng)賽、MATH-500以及軟件開(kāi)發(fā)領(lǐng)域測(cè)試集SWE-Bench Verified上取得了微弱優(yōu)勢(shì)。令人驚訝的是,這一切成就都是在不到600萬(wàn)美元的投入下實(shí)現(xiàn)的。
Deepseek的“四兩撥千斤”模式顛覆了人們對(duì)大模型行業(yè)“大力出奇跡”的傳統(tǒng)認(rèn)知,為大模型產(chǎn)業(yè)的落地提供了新的可能。這一創(chuàng)新不僅有望降低大模型的應(yīng)用門(mén)檻,還可能推動(dòng)整個(gè)行業(yè)向更高效、更經(jīng)濟(jì)的方向發(fā)展。