國產(chǎn)AI大模型DeepSeek近日在科技界掀起巨浪,成功超越ChatGPT,登頂蘋果中國與美國應(yīng)用商店免費APP下載排行榜,成為全球矚目的焦點。
據(jù)最新數(shù)據(jù)顯示,1月27日,DeepSeek不僅在中國區(qū)的蘋果App Store免費榜上占據(jù)首位,同時在美區(qū)也從之前的第六位躍升至榜首,將ChatGPT、Threads、Google Gemini及Microsoft Copilot等一系列知名生成式AI產(chǎn)品甩在身后。
然而,伴隨著爆火而來的,還有兩次服務(wù)中斷的小插曲。1月26日,DeepSeek曾遭遇短暫的服務(wù)崩潰,公司迅速回應(yīng)稱,這是由于新模型發(fā)布后用戶訪問量激增,服務(wù)器一時無法承載大量并發(fā)需求所致,問題已在極短時間內(nèi)得到解決。而就在今日,又有消息傳出,DeepSeek的服務(wù)狀態(tài)頁面顯示其網(wǎng)頁及API暫時不可用,公司正積極調(diào)查原因。
與眾多背靠互聯(lián)網(wǎng)大廠的國內(nèi)AI公司不同,DeepSeek由量化對沖基金幻方量化運營?;梅搅炕?016年便涉足AI領(lǐng)域,推出首個AI模型,并逐步將AI模型應(yīng)用于量化策略中。直至2023年,幻方量化正式成立創(chuàng)新性大模型公司DeepSeek。2024年12月,DeepSeek-V3首個版本上線并同步開源,其訓(xùn)練成本僅為557.6萬美元,整個訓(xùn)練過程僅需280萬個GPU小時。
DeepSeek的崛起不僅在國內(nèi)引起轟動,更迅速波及海外。硅谷的科技巨頭們紛紛對DeepSeek投來關(guān)注的目光。據(jù)報道,meta已成立四個專門研究小組,深入研究DeepSeek的工作原理,并計劃基于此改進(jìn)其旗下大模型Llama。
DeepSeek之所以能在科技圈引發(fā)如此大的反響,關(guān)鍵在于其以極低的成本訓(xùn)練出了能與ChatGPT相抗衡的人工智能大模型。據(jù)相關(guān)報道,DeepSeek的R1預(yù)訓(xùn)練費用僅為557.6萬美元,不到OpenAI GPT-4o模型訓(xùn)練成本的十分之一。同時,DeepSeek還公布了其API的定價,相較于OpenAI o1的運行成本,DeepSeek的收費顯得尤為親民。
華爾街對DeepSeek的崛起也做出了反應(yīng)。有美股大V在社交媒體上表示,DeepSeek的出現(xiàn)為AI巨頭們帶來了痛苦時刻,投資者必須對此保持警惕。AMD也宣布已將DeepSeek-V3模型集成到其Instinct MI300X GPU上,旨在實現(xiàn)最佳性能。這一舉動對于一直在AI領(lǐng)域風(fēng)光無限的英偉達(dá)來說,無疑是一個不小的挑戰(zhàn)。
DeepSeek的成功不僅吸引了業(yè)界的目光,更彰顯了本土人才在AI領(lǐng)域的巨大潛力。據(jù)了解,DeepSeek團(tuán)隊雖不到140人,但成員多為來自清華、北大等頂尖高校的應(yīng)屆博士畢業(yè)生、在讀生以及碩士生,且均為本土人才。DeepSeek的創(chuàng)始人梁文峰曾表示,公司的核心技術(shù)崗位主要由近年畢業(yè)的人員擔(dān)任。
隨著DeepSeek的爆火,公司也開始了新一輪的招聘。招聘網(wǎng)站顯示,DeepSeek的北京子公司正在廣納賢才,共放出了52個崗位,包括深度學(xué)習(xí)研究員、核心系統(tǒng)研發(fā)工程師等,薪資水平普遍較高。公司對于實習(xí)生的待遇也十分優(yōu)厚,AGI大模型實習(xí)生的日薪最高可達(dá)千元。