近期,DeepSeek在其官方社群中發(fā)布了一則重要通知,宣布其DeepSeek-V3模型已經(jīng)順利完成了小規(guī)模的版本迭代。用戶現(xiàn)在可以通過訪問DeepSeek的官方網(wǎng)站、應用程序以及小程序來體驗這一新版本,不過需要注意的是,在試用期間,“深度思考”功能將暫時關閉。與此同時,API接口及使用方法維持原樣,無需做出調(diào)整。
盡管官方并未詳細披露此次升級的具體改動內(nèi)容,但據(jù)知情人士透露,DeepSeek-V3模型自去年12月面世并開放源代碼以來,便以其強大的性能引起了業(yè)界的廣泛關注。作為一款由DeepSeek自主研發(fā)的MoE模型,DeepSeek-V3擁有高達671B的參數(shù)規(guī)模,在多項評測中的表現(xiàn)均超越了Qwen2.5-72B和Llama-3.1-405B等其他知名的開源模型。更為引人注目的是,DeepSeek-V3在性能上與世界領先的閉源模型GPT-4o以及Claude-3.5-Sonnet不相上下,展現(xiàn)出了強大的競爭力。
DeepSeek在今年1月還推出了DeepSeek-R1推理模型,并同樣選擇了開源。這款模型在性能上與OpenAI的o1正式版相媲美,憑借其低廉的訓練成本和高效的性能,在全球范圍內(nèi)迅速走紅,贏得了眾多開發(fā)者和用戶的青睞。