在剛剛過去的春節(jié)假期,一款名為DeepSeek的中國國產(chǎn)大模型意外走紅,成為了科技領(lǐng)域的話題焦點。這款大模型不僅引起了業(yè)界的廣泛關(guān)注,還深入到了普通人的生活與工作中。
DeepSeek的發(fā)布可以追溯到1月20日,由中國大模型公司深度求索推出其推理大模型DeepSeek-R1。該模型的發(fā)布迅速在業(yè)界引起了轟動,僅僅一周后的1月27日,DeepSeek應(yīng)用便成功登頂蘋果中國區(qū)和美國區(qū)應(yīng)用商店的免費App下載排行榜。緊接著,在1月31日,美國科技巨頭英偉達、亞馬遜和微軟在同一天宣布接入DeepSeek-R1,進一步彰顯了其影響力。
DeepSeek的成功不僅僅是AI領(lǐng)域的一次突破,更是一次破圈現(xiàn)象。它不僅在技術(shù)上達到了國際先進水平,更重要的是,其可用程度和完成度極高,引發(fā)了廣泛的討論,從而吸引了眾多普通人的關(guān)注。這款大模型的出現(xiàn),讓AI技術(shù)更加貼近人們的生活,成為了他們?nèi)粘9ぷ骱蜕畹囊徊糠帧?/p>
DeepSeek的成功也體現(xiàn)了國產(chǎn)大模型的能力。它不僅展示了中國AI技術(shù)的實力,還有望追趕甚至反超世界先進水平。DeepSeek還大幅降低了AI模型的訓(xùn)練成本。據(jù)悉,其R1模型的訓(xùn)練成本僅為557.6萬美元,相比之下,OpenAI的GPT模型訓(xùn)練成本則高達1億美元。
面對DeepSeek所取得的成就和業(yè)界的廣泛贊譽,深度求索(DeepSeek)的創(chuàng)始人梁文鋒卻表現(xiàn)得十分謙遜。他表示:“我們不過是站在開源社區(qū)巨人們的肩膀上,給國產(chǎn)大模型這棟大廈多擰了幾顆螺絲?!绷何匿h所提到的“巨人”——開源社區(qū),即開放源代碼,它允許用戶利用源代碼進行修改和學(xué)習(xí),為技術(shù)的發(fā)展提供了巨大的推動力。
開源策略不僅具有世界大同的美好愿景,同時也承載著利益動機。通過開源,可以吸引全球開發(fā)者和研究者的關(guān)注,形成一個強大的技術(shù)社區(qū)。這個社區(qū)具備敏捷性和協(xié)作優(yōu)勢,能夠形成“技術(shù)共享-生態(tài)繁榮-反哺創(chuàng)新”的正向循環(huán)。因此,在競爭中處于弱勢的一方往往會選擇開源策略來扭轉(zhuǎn)局勢。在計算機行業(yè)中,一個封閉的生態(tài)往往對應(yīng)著一個開放的、開源的生態(tài)。
如今,開源已經(jīng)成為AI迅猛發(fā)展的助推劑。meta首席人工智能科學(xué)家、2018年圖靈獎得主楊立昆在評價DeepSeek時指出:“與其說是中國在人工智能上超越美國,不如說是開源代碼正在超越私有模式。DeepSeek從開放研究和開放源碼中受益良多,例如meta的PyTorch和LLaMA等項目。”
實際上,meta在推動AI大模型開源方面發(fā)揮了重要作用。從LLaMA大模型到圖像分割模型Segment-Anything,meta開源的項目覆蓋了各種模態(tài)和場景。其中,LLaMA是最強大的開源大模型之一。2023年7月,meta發(fā)布的LLaMA2更是將開源協(xié)議從“僅研究可用”轉(zhuǎn)向“免費可商用”,雖然催生了一大批“套殼大模型”,但也改變了大模型競爭中OpenAI獨占鰲頭的格局。在這些開源大模型中,DeepSeek無疑是最強大的之一。
DeepSeek的成功驗證了開源模型可以接近甚至達到閉源性能的水平,這反過來將促使meta等巨頭加大對開源AI的投入。最近,meta又開源了多個AI項目,包括圖像分割模型SAM 2.1、多模態(tài)語言模型Spirit LM等,進一步提升了AI在圖像處理和語音識別領(lǐng)域的能力。
然而,盡管開源促進了AI的迅猛發(fā)展,但我們也應(yīng)該看到其中的隱憂。開源的本質(zhì)是用開放促效率,但在當(dāng)今世界,效率在很多時候已經(jīng)不再是第一位的考慮。AI技術(shù)是由軟硬件兩方面構(gòu)成的,在硬件逐漸走向封閉的同時,軟件的開源是否也會走向封閉?這是一個值得中國AI界深思的問題。因此,我們需要提前做好應(yīng)對之策,用創(chuàng)新和開放來回應(yīng)封閉的挑戰(zhàn),正如DeepSeek所做的那樣。