滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 數(shù)碼極客 > 正文內(nèi)容

2025高考數(shù)學(xué)大考：AI誰(shuí)最聰明？DeepSeek、訊飛星火突破140分大關(guān)！

時(shí)間：2025-06-08 18:07 作者：顧青青

2025年高考數(shù)學(xué)考試剛剛落下帷幕，考生們紛紛在網(wǎng)絡(luò)上分享他們對(duì)試卷難度的看法，尤其是數(shù)學(xué)科目，瞬間成為熱議話題。作為科技領(lǐng)域的觀察者，我們不禁好奇，今年的高考數(shù)學(xué)試卷對(duì)于炙手可熱的AI來(lái)說(shuō)，難度究竟如何？

為了解答這個(gè)問(wèn)題，我們組織了一場(chǎng)特別的“考試”，邀請(qǐng)了七位AI大模型“考生”參與，它們分別是DeepSeek R1 0528、通義千問(wèn) Qwen3-235B-A22B、訊飛星火 X1-0420、豆包 Seed-Thinking-v1.5、文心 X1 Turbo、騰訊混元 Hunyuan T1 latest以及GPT o3。我們將使用一套完整的高考數(shù)學(xué)試卷來(lái)測(cè)試它們的表現(xiàn)，并邀請(qǐng)了一位經(jīng)驗(yàn)豐富的數(shù)學(xué)教研專家汪鵬老師進(jìn)行評(píng)分。

由于網(wǎng)絡(luò)上流傳的試卷版本眾多，存在不完整和差異，我們采取了多版本交叉驗(yàn)證與教師解題驗(yàn)證的方式，確保評(píng)分的準(zhǔn)確性?？偡衷O(shè)定為150分。

首先，我們來(lái)看一道較為簡(jiǎn)單的選擇題。這道題目對(duì)于所有AI大模型來(lái)說(shuō)都顯得輕而易舉，DeepSeek R1、通義千問(wèn)、訊飛星火、豆包、文心一言、騰訊混元以及GPT o3均給出了正確答案。

接下來(lái)，我們?cè)黾恿艘恍╇y度，考察了一道涉及函數(shù)的選擇題。同樣，所有AI大模型均成功解答了這道題目，顯示出它們?cè)谔幚頂?shù)學(xué)邏輯問(wèn)題上的強(qiáng)大能力。

面對(duì)更復(fù)雜的對(duì)數(shù)函數(shù)題，AI大模型們展現(xiàn)出了不同的解題能力。DeepSeek R1和豆包在這道題目上出現(xiàn)了錯(cuò)誤，而其他AI大模型則成功給出了正確答案。這顯示了AI在處理復(fù)雜數(shù)學(xué)問(wèn)題時(shí)，其表現(xiàn)仍然存在差異。

在解答題部分，我們選取了第16題作為例子，這道題涉及數(shù)列和函數(shù)知識(shí)點(diǎn)，要求AI不僅給出正確答案，還需要展示清晰的解題過(guò)程。DeepSeek R1、通義千問(wèn)、訊飛星火和豆包均在這一題上表現(xiàn)出色，得到了滿分。而文心一言和騰訊混元?jiǎng)t因解題過(guò)程中的錯(cuò)誤而失分。

最后，我們挑戰(zhàn)了難度更高的第18題。訊飛星火、豆包、DeepSeek R1、通義千問(wèn)以及GPT o3均在這一題上獲得了滿分，而文心X1則因答案錯(cuò)誤而失分。這進(jìn)一步證明了AI在處理高難度數(shù)學(xué)問(wèn)題上的潛力。

經(jīng)過(guò)這場(chǎng)“考試”，DeepSeek R1以143分的成績(jī)位列榜首，訊飛星火以141分緊隨其后，GPT o3則以138分獲得第三名。這些AI大模型在數(shù)學(xué)能力上的表現(xiàn)令人矚目，展示了AI在教育領(lǐng)域的巨大潛力。

值得注意的是，雖然DeepSeek R1在分?jǐn)?shù)上領(lǐng)先，但其在OCR識(shí)別效果和推理速度上仍存在短板。而訊飛星火則憑借其較小的模型量級(jí)和高效的數(shù)學(xué)能力，展現(xiàn)出了強(qiáng)大的競(jìng)爭(zhēng)力。豆包、通義千問(wèn)等大模型也緊隨其后，與國(guó)際頂尖模型水平相當(dāng)。

此次AI大模型參與“2025高考數(shù)學(xué)”考試，不僅是對(duì)AI數(shù)學(xué)能力的一次檢驗(yàn)，更是對(duì)AI在教育領(lǐng)域應(yīng)用潛力的一次探索。隨著AI技術(shù)的不斷發(fā)展，我們有理由相信，AI將在未來(lái)的教育領(lǐng)域中發(fā)揮更加重要的作用。

更多>同類內(nèi)容

Dacora新車亮相，挑戰(zhàn)凱迪拉克！美產(chǎn)超豪華轎車能否引領(lǐng)復(fù)古新風(fēng)尚？

06-11

小米SU7 Ultra量產(chǎn)版刷新紐北電動(dòng)車圈速記錄，7分04秒957！

06-11

聯(lián)發(fā)科5月營(yíng)收出爐：451.81億新臺(tái)幣，同比增長(zhǎng)7.19%，環(huán)比略降

06-11

索尼PS嗨玩季“Days of Play”盛宴尾聲，抓緊最后時(shí)光暢享游戲折扣！

06-11

《劍星》伊芙乳膠戰(zhàn)斗服MOD來(lái)襲，雙版本安裝解鎖新裝扮！

06-11

廣州拓品DX5 II全平衡解碼耳放一體機(jī)，1999元升級(jí)上市！

06-11

蘋果iOS代碼曝光：AirPods Pro 3或?qū)⑶锛玖料啵鹿δ軗屜瓤矗?/a>

06-11

蘋果宣布：macOS 28起將逐步淘汰Rosetta 2，英特爾Mac時(shí)代走向終結(jié)

06-11

特斯拉：低起火風(fēng)險(xiǎn)成車主轉(zhuǎn)向電動(dòng)車重要考量

06-11

安伯尼克RG 35XXPro復(fù)古掌機(jī)上新：雙搖桿加持，首發(fā)僅售298元！

06-11

寧德時(shí)代與理想汽車共慶：百萬(wàn)臺(tái)專屬電池包里程碑達(dá)成！

06-11

搜狐酒館第21期丨谷小酒董事長(zhǎng)兼CEO劉飛：以產(chǎn)品品質(zhì)與用戶體驗(yàn)構(gòu)建壁壘，推動(dòng)光瓶酒品質(zhì)化發(fā)展

06-10

李振國(guó)辭任隆基綠能總經(jīng)理，辭職前年薪從816萬(wàn)降至84萬(wàn)

06-10

Q1業(yè)績(jī)大超預(yù)期僅僅是開始，小米手里還有牌沒出

06-10

萬(wàn)辰集團(tuán)股價(jià)飆升：一年暴漲10倍，凈利潤(rùn)率不足1%；加盟好想來(lái)還是一門好生意嗎?

06-10

點(diǎn)擊查看更多 +

全站最新

蘋果Vision Pro新突破：APMP文件解鎖多元沉浸式視頻體驗(yàn)

法國(guó)Mistral實(shí)驗(yàn)室新推Magistral系列，推理AI能否后來(lái)居上？

Dacora新車亮相，挑戰(zhàn)凱迪拉克！美產(chǎn)超豪華轎車能否引領(lǐng)復(fù)古新風(fēng)尚？

Xcode 26大升級(jí)！蘋果Swift Assist新增端側(cè)及Claude等AI模型支持

蘋果AI模型更新，服務(wù)器端表現(xiàn)不敵OpenAI GPT-4o，競(jìng)爭(zhēng)力何在？

特斯拉Robotaxi將載客，首輛全自動(dòng)駕駛車6月28日出廠直送客戶家

熱門內(nèi)容

本欄最新

Dacora新車亮相，挑戰(zhàn)凱迪拉克！美產(chǎn)超豪華轎車能否引領(lǐng)復(fù)古新風(fēng)尚？

小米SU7 Ultra量產(chǎn)版刷新紐北電動(dòng)車圈速記錄，7分04秒957！

索尼PS嗨玩季“Days of Play”盛宴尾聲，抓緊最后時(shí)光暢享游戲折扣！

《劍星》伊芙乳膠戰(zhàn)斗服MOD來(lái)襲，雙版本安裝解鎖新裝扮！

蘋果iOS代碼曝光：AirPods Pro 3或?qū)⑶锛玖料啵鹿δ軗屜瓤矗? /></a></div>
<div id=

蘋果宣布：macOS 28起將逐步淘汰Rosetta 2，英特爾Mac時(shí)代走向終結(jié)

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來(lái) - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國(guó) · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊(cè)商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

2025高考數(shù)學(xué)大考：AI誰(shuí)最聰明？DeepSeek、訊飛星火突破140分大關(guān)！

2025高考數(shù)學(xué)大考：AI誰(shuí)最聰明？DeepSeek、訊飛星火突破140分大關(guān)！