在龍年即將落幕,蛇年悄然開啟之際,一場科技界的“驚蟄”悄然上演。一家名為DeepSeek(深度求索)的中國初創(chuàng)公司,以其大模型DeepSeek-V3,在全球范圍內(nèi)引發(fā)了科技圈和華爾街的震動。
1月27日,美國人工智能主題股票遭遇拋售潮,其中英偉達股價暴跌16.97%,市值一日之內(nèi)蒸發(fā)近6000億美元,創(chuàng)造了美國歷史上單日市值損失之最。這一事件的幕后推手,正是DeepSeek-V3。該模型發(fā)布后迅速登頂美國蘋果App商店免費下載排行榜,其影響力可見一斑。
緊接著,在除夕夜前一晚的1月28日凌晨,DeepSeek又宣布開源其多模態(tài)模型Janus-Pro-7B,并聲稱在Geneval和DPG-Bench基準(zhǔn)測試中擊敗了OpenAI的DALL-E 3和Stable Diffusion。這一消息再次震撼了科技界。
然而,DeepSeek的崛起也引發(fā)了美國的擔(dān)憂。多名美國官員回應(yīng)稱,DeepSeek對美國構(gòu)成了威脅,正對其開展國家安全調(diào)查。面對外部壓力,360集團創(chuàng)始人、董事長周鴻祎在微博上表示,如果DeepSeek有需要,360愿意提供網(wǎng)絡(luò)安全方面的全力支持。
DeepSeek的崛起無疑給全球科技界帶來了巨大沖擊。在軟銀宣布準(zhǔn)備投資5000億美元用于AI基礎(chǔ)建設(shè)之際,DeepSeek-R1的發(fā)布更是讓全球科技界為之震動。這是一個完全開源的模型,從代碼到架構(gòu)再到訓(xùn)練方法,都可以隨意查看、修改和使用。據(jù)DeepSeek官方發(fā)布的數(shù)據(jù),該模型在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能,已經(jīng)比肩美國OpenAI公司最新的o1大模型正式版。
DeepSeek的創(chuàng)新之處在于,它并沒有盲目追求算力的堆砌,而是專注于算法的創(chuàng)新,從而減少了對計算資源的需求。據(jù)悉,R1完全拋棄了傳統(tǒng)監(jiān)督學(xué)習(xí)路線,通過動態(tài)路由算法壓縮了80%的冗余計算,以在有限的運算能力中實現(xiàn)高性能。R1的訓(xùn)練成本也極低,其API定價遠低于OpenAI的ChatGPT-o1。
DeepSeek的崛起讓AI變得更加廉價、高效,或?qū)⒊蔀榇笳Z言模型發(fā)展史上的典范。這一創(chuàng)新不僅讓美國各大模型感受到了降維打擊,也顛覆了他們傳統(tǒng)的“燒錢”信仰。AMD宣布已將DeepSeek-V3模型集成到其GPU上,以實現(xiàn)最佳性能。而meta公司的員工則發(fā)文稱,由于DeepSeek的低成本高性能,他們公司的人工智能部門已經(jīng)陷入恐慌。
國內(nèi)大廠也被DeepSeek的崛起所激勵。阿里云在除夕夜加班發(fā)布了通義千問旗艦版模型Qwen2.5-Max,并聲稱在多項測試中全面超越GPT-4o、DeepSeek-V3、Llama-3.1等模型。這無疑展示了中國AI技術(shù)的快速進步。
然而,盡管DeepSeek在全球范圍內(nèi)引發(fā)了巨大關(guān)注,但談及其已經(jīng)“贏麻了”還為時尚早。雖然DeepSeek在中文語境下的表現(xiàn)較為優(yōu)秀,但在文生圖創(chuàng)作方面卻令人失望。DeepSeek仍然依賴于美國的算力生態(tài),其訓(xùn)練仍然依賴英偉達GPU。多位業(yè)內(nèi)人士認(rèn)為,DeepSeek的訓(xùn)練方式仍然依賴于堆積算力,而非真正的突破。
同時,DeepSeek也面臨著惡意攻擊和宕機的風(fēng)險。由于其用戶數(shù)的暴增和完全開源的技術(shù)生態(tài),DeepSeek可能處于更高的風(fēng)險之中。在實際使用中,用戶也會發(fā)現(xiàn)DeepSeek宣告宕機的頻次比之前要高得多。
盡管如此,DeepSeek的出圈仍然是中國AI算法的突破,值得我們肯定和自豪。DeepSeek的創(chuàng)始人梁文鋒在回應(yīng)“國運級別的科技成果”的盛贊時表示,團隊只是站在開源社區(qū)巨人們的肩膀上,給國產(chǎn)大模型這棟大廈多擰了幾顆螺絲。他的清醒和謙遜讓我們看到了中國AI技術(shù)的未來希望。
DeepSeek的崛起不僅展示了中國AI技術(shù)的實力,也給全球科技界帶來了新的挑戰(zhàn)和機遇。我們期待在未來的發(fā)展中,DeepSeek能夠繼續(xù)保持其創(chuàng)新精神,為全球AI技術(shù)的發(fā)展做出更大的貢獻。