滾動資訊

當前位置：網(wǎng)界 > 行業(yè)動態(tài) > 正文內(nèi)容

DeepSeek R1模型升級，思維深度提升，表現(xiàn)逼近國際頂尖水平！

時間：2025-05-30 00:13 作者：朱天宇

DeepSeek公司近期宣布，其R1模型已順利完成一次重要的版本迭代，新版本被命名為DeepSeek-R1-0528。這一消息于5月29日晚間正式對外發(fā)布。

據(jù)悉，DeepSeek-R1-0528依舊基于2024年12月推出的DeepSeek V3 Base模型構建，但在后訓練階段加大了算力的投入，從而顯著增強了模型的思維深度和推理能力。這一改進使得R1模型在多個關鍵領域的表現(xiàn)上邁上了新的臺階。

在新版本的測評中，DeepSeek-R1-0528在數(shù)學、編程以及通用邏輯等領域均取得了卓越的成績，不僅在國內(nèi)模型中獨占鰲頭，而且在整體表現(xiàn)上已經(jīng)逼近了國際頂尖模型，如o3和Gemini-2.5-Pro。這一成就標志著DeepSeek在人工智能領域的技術實力又向前邁進了一大步。

特別是在復雜推理任務的處理上，新版R1模型相較于舊版有了質(zhì)的飛躍。以AIME 2025測試為例，新版模型的準確率從舊版的70%大幅提升至87.5%。這一顯著進步得益于模型在推理過程中思維深度的增強，使得它能夠更加深入地分析和解決問題。

新版R1模型在解題過程中使用的tokens數(shù)量也大幅增加。在AIME 2025測試集上，舊版模型平均每題使用12K tokens，而新版模型則達到了23K tokens。這一變化表明，新版模型在解題時進行了更為詳盡和深入的思考，從而得出了更為準確的答案。

DeepSeek還利用DeepSeek-R1-0528的思維鏈對Qwen3-8B Base進行了蒸餾訓練，成功推出了DeepSeek-R1-0528-Qwen3-8B模型。這一8B模型在數(shù)學測試AIME 2024中的表現(xiàn)同樣令人矚目，僅次于DeepSeek-R1-0528，超越了Qwen3-8B（+10.0%），與Qwen3-235B旗鼓相當。這一成果進一步證明了DeepSeek在模型優(yōu)化和訓練方面的卓越能力。

DeepSeek表示，DeepSeek-R1-0528的思維鏈對于學術界和工業(yè)界都具有重要意義。它將有助于推動推理模型的研究和發(fā)展，并為小模型的開發(fā)提供新的思路和方法。

除了推理能力的提升外，新版DeepSeek R1還在其他方面進行了優(yōu)化。針對“幻覺”問題，新版模型進行了針對性改進。與舊版相比，更新后的模型在改寫潤色、總結摘要、閱讀理解等場景中，幻覺率降低了約45%～50%，從而能夠為用戶提供更加準確和可靠的結果。

在創(chuàng)意寫作方面，新版R1模型也取得了顯著進步。它在議論文、小說、散文等文體上進行了優(yōu)化，能夠輸出篇幅更長、結構更完整、內(nèi)容更豐富的長篇作品。同時，其寫作風格也更加貼近人類的偏好，使得生成的文本更加自然和流暢。

更多>同類內(nèi)容

新款沃爾沃S90煥新上市，尊享價30.09萬起，內(nèi)飾外觀全面升級！

05-29

蘋果WWDC25或推iOS 26等新品，版本號命名方式將大變？

05-29

DeepSeek-R1-0528升級，百度智能云千帆與文小言攜手接入新模型

05-29

法拉第未來股東大會順利，賈躍亭增持股票力挺公司未來發(fā)展

05-29

六大巨頭聯(lián)手！共筑終端智能體生態(tài)新藍圖

05-29

真我Neo7 Turbo發(fā)布：透明后殼設計亮眼，天璣9400e性能強勁僅1999元起

05-29

Telegram攜手xAI，3億美元合作將人工智能Grok引入社交平臺

05-29

索泰迷你主機Magnus EN75060TC來襲，搭載RTX 5060 Ti性能爆棚

05-29

雙喜臨門！我國接連成功發(fā)射實踐二十六號衛(wèi)星與天問二號探測器

05-29

《荒野大鏢客：救贖2》七周年，西部神作幕后艱辛與未來新動向

05-29

Windows 11開始菜單新變：React Native重構引發(fā)CPU占用爭議

05-29

漫威黑豹游戲夢碎！EA項目取消，曝光概念圖讓人惋惜不已

05-29

吉利吉曜通行發(fā)布金磚電芯超混新品，末端快充僅需11.5分鐘刷新記錄

05-29

618過半，精明消費者如何借分期免息讓錢包更“活”起來？

05-29

vivo TWS Air3半入耳耳機發(fā)布：時尚配色+超長續(xù)航，僅售99元！

05-29

點擊查看更多 +

全站最新

百度千帆平臺正式上線DeepSeek-R1-0528大模型，能力全面提升

新款沃爾沃S90煥新上市，尊享價30.09萬起，內(nèi)飾外觀全面升級！

蘋果WWDC25或推iOS 26等新品，版本號命名方式將大變？

Stellantis與亞馬遜SmartCockpit合作終結，智能座艙未來或將擁抱安卓

英偉達CEO黃仁勛擬售股套現(xiàn)最多8.4億美元，為何大手筆減持？

雷諾Alpine打造V6混動超跑，劍指法拉利，千匹馬力引期待

熱門內(nèi)容

本欄最新

DeepSeek R1模型升級，思維深度提升，表現(xiàn)逼近國際頂尖水平！

新款沃爾沃S90煥新上市，尊享價30.09萬起，內(nèi)飾外觀全面升級！

蘋果WWDC25或推iOS 26等新品，版本號命名方式將大變？

法拉第未來股東大會順利，賈躍亭增持股票力挺公司未來發(fā)展

六大巨頭聯(lián)手！共筑終端智能體生態(tài)新藍圖

真我Neo7 Turbo發(fā)布：透明后殼設計亮眼，天璣9400e性能強勁僅1999元起

網(wǎng)界 - 新財經(jīng) 新科技新未來 - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國 · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊商標，是該商標的唯一持有者，未經(jīng)授本公司授權，嚴禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

DeepSeek R1模型升級，思維深度提升，表現(xiàn)逼近國際頂尖水平！

DeepSeek R1模型升級，思維深度提升，表現(xiàn)逼近國際頂尖水平！