滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 智能出行 > 正文內(nèi)容

AI高考大考：DeepSeek、訊飛星火領(lǐng)跑，數(shù)學(xué)能力誰(shuí)更強(qiáng)？

時(shí)間：2025-06-08 18:06 作者：鐘景軒

在2025年高考數(shù)學(xué)科目考試結(jié)束后，網(wǎng)絡(luò)上關(guān)于試卷難度的討論熱度不減。作為科技領(lǐng)域的觀察者，我們不禁好奇，對(duì)于當(dāng)前備受矚目的AI技術(shù)而言，這份數(shù)學(xué)試卷是否同樣具有挑戰(zhàn)性？為了回答這個(gè)問(wèn)題，我們組織了一場(chǎng)特別的“考試”，邀請(qǐng)了多家知名的大模型參與，模擬完成了一套高考數(shù)學(xué)試卷。

本次“考試”中，我們挑選了以下幾家具有代表性的大模型作為“考生”：DeepSeek R1 0528、通義千問(wèn) Qwen3-235B-A22B、訊飛星火 X1-0420、豆包 Seed-Thinking-v1.5、文心 X1 Turbo、騰訊混元 Hunyuan T1 latest和GPT o3。由于網(wǎng)絡(luò)流傳的試題版本不一，我們通過(guò)多版本交叉驗(yàn)證和教師解題驗(yàn)證的方式，確保評(píng)測(cè)的準(zhǔn)確性，試卷總分為150分。

我們特別邀請(qǐng)了一位擁有十年高中數(shù)學(xué)教研經(jīng)驗(yàn)的專家汪鵬老師，對(duì)大模型的答案進(jìn)行評(píng)分?？紤]到部分模型在OCR識(shí)別方面的限制，我們采用了OCR轉(zhuǎn)寫后輸入答題的方式進(jìn)行處理。

接下來(lái)，讓我們通過(guò)幾道典型題目，看看這些大模型的表現(xiàn)如何。

首先是選擇題第一題，各家大模型均給出了正確答案，顯示出它們?cè)诨A(chǔ)題目上的穩(wěn)定表現(xiàn)。

選擇題第五題是一道涉及函數(shù)的題目，所有大模型再次全部答對(duì)，進(jìn)一步證明了它們?cè)趶?fù)雜題目上的解題能力。

然而，在選擇題第八題中，豆包大模型和DeepSeek出現(xiàn)了錯(cuò)誤，而其他模型均給出了正確答案。這道題目涉及對(duì)數(shù)函數(shù)，顯示出部分模型在處理特定數(shù)學(xué)知識(shí)點(diǎn)時(shí)的局限性。

在解答題方面，我們以第16題為例，這是一道涉及數(shù)列和函數(shù)的題目。DeepSeek、通義千問(wèn)、訊飛星火和豆包大模型均給出了正確的解題過(guò)程和答案，而文心X1和騰訊混元?jiǎng)t出現(xiàn)了不同程度的錯(cuò)誤。

最后，我們來(lái)看難度更高的第18題。訊飛星火、豆包大模型、DeepSeek、通義千問(wèn)和GPT o3均獲得了滿分，而文心X1則因答案錯(cuò)誤而失分。

經(jīng)過(guò)綜合評(píng)分，DeepSeek以143分的成績(jī)位列榜首，訊飛星火以141分緊隨其后，GPT o3以138分獲得第三名。這次“考試”不僅展示了AI在數(shù)學(xué)領(lǐng)域的強(qiáng)大能力，也暴露了部分模型在實(shí)際應(yīng)用中的短板。

DeepSeek作為最新版本的大模型，在思考推理和數(shù)學(xué)能力方面表現(xiàn)出色，但OCR識(shí)別效果不佳，且推理速度慢、資源消耗高。訊飛星火則憑借其較小的模型量級(jí)和高效的數(shù)學(xué)能力，在評(píng)測(cè)中取得了優(yōu)異成績(jī)，顯示出其在教育領(lǐng)域的深厚積累。

豆包和通義千問(wèn)等大模型也表現(xiàn)出色，與國(guó)際頂尖模型水平相當(dāng)。這次“考試”不僅是對(duì)AI數(shù)學(xué)能力的一次檢驗(yàn)，更是對(duì)未來(lái)AI在教育領(lǐng)域深度應(yīng)用的一次探索。

更多>同類內(nèi)容

美企Venture Global獲151億美元融資，加速擴(kuò)大對(duì)歐天然氣出口

07-29

國(guó)際復(fù)材7月25日融資動(dòng)態(tài)：凈買入為負(fù)，融資融券余額降至2.5億

07-28

加拿大鵝遇寒流：貝恩資本欲撤資，奢侈品神話還能續(xù)寫嗎？

07-28

綠芯智能芯片技術(shù)革新，助力可再生能源市場(chǎng)，500億藍(lán)海待挖掘

07-28

福建民企打造全球最大烷烴一體化基地，300億投資助力石化產(chǎn)業(yè)升級(jí)！

07-28

納指ETF富國(guó)7月25日融資凈買入超63萬(wàn)，融資融券余額漲近2%

07-28

外資熱投中國(guó)，“新質(zhì)生產(chǎn)力”領(lǐng)域成外資新寵兒

07-28

上半年外資大項(xiàng)目頻落地，我國(guó)引資質(zhì)量與結(jié)構(gòu)實(shí)現(xiàn)雙提升！

07-27

英特爾巨虧后大裁員，取消歐洲建廠計(jì)劃求重生？

07-27

青港澳美食文創(chuàng)遇上啤酒節(jié)，第35屆青島嶗山會(huì)場(chǎng)點(diǎn)燃消費(fèi)熱情！

07-27

關(guān)稅戰(zhàn)塵埃落定，中國(guó)稅率意外成全球最低，美國(guó)何去何從？

07-27

外資深耕中國(guó)，新質(zhì)生產(chǎn)力領(lǐng)域成投資熱土

07-27

吉林大安：全球最大綠氨單體項(xiàng)目投產(chǎn)，引領(lǐng)綠色能源新跨越！

07-27

深圳海港口岸國(guó)際中轉(zhuǎn)區(qū)啟用，旅客換乘體驗(yàn)大升級(jí)！

07-26

京東185億意向收購(gòu)德國(guó)零售巨頭Ceconomy布局歐洲

近日，有關(guān)京東集團(tuán)可能收購(gòu)德國(guó)消費(fèi)電子零售商Ceconomy的消息引起了廣泛關(guān)注。據(jù)悉，雙方目前正在進(jìn)行深入的談判，京東考慮以每股4.60歐元現(xiàn)金提出公開(kāi)收購(gòu)要約，對(duì)Ceconomy的整體估值約為22億歐元，折合人民幣約185億元。

07-26

點(diǎn)擊查看更多 +

全站最新

NASA探秘靈神星：700萬(wàn)億歐元金屬礦藏，人類能否共享這份宇宙財(cái)富？

2025中國(guó)國(guó)際涂料展：綠色轉(zhuǎn)型新風(fēng)向，涂料產(chǎn)業(yè)革新正當(dāng)時(shí)

金涌投資豪擲千萬(wàn)美元，布局Web3.0及以太幣等虛擬資產(chǎn)

奧本海默看好標(biāo)普500漲至7100點(diǎn)，貿(mào)易協(xié)議助力股市延續(xù)牛市行情？

劉強(qiáng)東全球化步伐加快，競(jìng)購(gòu)德國(guó)零售巨頭，香港布局成新焦點(diǎn)

山金國(guó)際踏上新征程，擬香港聯(lián)交所主板上市深化全球化戰(zhàn)略

熱門內(nèi)容

本欄最新

美企Venture Global獲151億美元融資，加速擴(kuò)大對(duì)歐天然氣出口

加拿大鵝遇寒流：貝恩資本欲撤資，奢侈品神話還能續(xù)寫嗎？

綠芯智能芯片技術(shù)革新，助力可再生能源市場(chǎng)，500億藍(lán)海待挖掘

福建民企打造全球最大烷烴一體化基地，300億投資助力石化產(chǎn)業(yè)升級(jí)！

外資熱投中國(guó)，“新質(zhì)生產(chǎn)力”領(lǐng)域成外資新寵兒

上半年外資大項(xiàng)目頻落地，我國(guó)引資質(zhì)量與結(jié)構(gòu)實(shí)現(xiàn)雙提升！

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來(lái) - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國(guó) · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊(cè)商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

AI高考大考：DeepSeek、訊飛星火領(lǐng)跑，數(shù)學(xué)能力誰(shuí)更強(qiáng)？

AI高考大考：DeepSeek、訊飛星火領(lǐng)跑，數(shù)學(xué)能力誰(shuí)更強(qiáng)？