滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 科技人物 > 正文內(nèi)容

{中美AI“考生”東大入學(xué)考：英語(yǔ)超群數(shù)學(xué)短板，能否預(yù)示AI未來(lái)？）

時(shí)間：2025-04-07 13:04 作者：陸辰風(fēng)

近期，據(jù)日經(jīng)新聞披露的一項(xiàng)聯(lián)合研究成果顯示，中美兩國(guó)的新型生成式人工智能（AI）已經(jīng)展現(xiàn)出令人矚目的學(xué)術(shù)能力，成功跨越了日本頂尖學(xué)府——東京大學(xué)理科3類(lèi)入學(xué)考試的門(mén)檻。這一突破性進(jìn)展是通過(guò)對(duì)比測(cè)試美國(guó)OpenAI的“o1”模型與中國(guó)AI初創(chuàng)企業(yè)DeepSeek的“R1”模型得出的。

測(cè)試內(nèi)容涵蓋了2025年度的東京大學(xué)入學(xué)考試科目，由AI初創(chuàng)公司Life Prompt提供答案輸出，并由知名預(yù)備學(xué)校河合塾的專(zhuān)業(yè)講師進(jìn)行評(píng)分。結(jié)果顯示，在兩個(gè)基礎(chǔ)模型的表現(xiàn)中，o1獲得了374分，R1緊隨其后，取得了369分，均超過(guò)了東大理科3類(lèi)合格的最低分?jǐn)?shù)線(xiàn)368.7分。

值得注意的是，盡管R1在理科1類(lèi)和理科2類(lèi)的共通考試中未能達(dá)到合格線(xiàn)，但在其他類(lèi)別，包括文科在內(nèi)，它與o1均成功“合格”。這一表現(xiàn)不僅展示了AI在跨學(xué)科應(yīng)用上的潛力，也反映了其在學(xué)術(shù)評(píng)估中的廣泛適用性。

在具體的考試科目中，英語(yǔ)成為了AI模型的強(qiáng)項(xiàng)。o1和R1在英語(yǔ)部分的得分率均超過(guò)了75%，河合塾的英語(yǔ)講師久恒秀雄對(duì)此評(píng)價(jià)道：“這兩個(gè)模型在英語(yǔ)表達(dá)上幾乎沒(méi)有單詞和語(yǔ)法的錯(cuò)誤，其水平遠(yuǎn)遠(yuǎn)超過(guò)了東大考生的平均水平?！?/p>

然而，在數(shù)學(xué)科目上，盡管AI模型能夠正確解答出不少最終答案，但在圖形處理和論證問(wèn)題上卻頻繁出現(xiàn)論述錯(cuò)誤和說(shuō)明不足的情況。在滿(mǎn)分為120分的理科數(shù)學(xué)考試中，o1得了38分，R1得了49分，這一成績(jī)顯著低于合格者的平均分。負(fù)責(zé)數(shù)學(xué)評(píng)分的香坂季京講師指出：“AI在數(shù)學(xué)論證上的表現(xiàn)還有待提高?！?/p>

對(duì)于這一研究成果，自2011年起便致力于“機(jī)器人能否進(jìn)入東京大學(xué)”項(xiàng)目的國(guó)立信息學(xué)研究所新井紀(jì)子教授給予了高度評(píng)價(jià)：“這是AI成長(zhǎng)歷程中的一個(gè)重要里程碑。然而，我們也必須認(rèn)識(shí)到，AI有時(shí)會(huì)給出令人困惑甚至錯(cuò)誤的答案。因此，培養(yǎng)能夠正確判斷并熟練使用AI輸出的人才顯得尤為重要?！?/p>

更多>同類(lèi)內(nèi)容

TMR傳感器能否終結(jié)游戲搖桿漂移問(wèn)題？

04-07

七彩虹CVN X870 ARK FROZEN V14主板發(fā)布：搭載顯卡快拆，強(qiáng)化存儲(chǔ)性能

04-07

A股公司如何應(yīng)對(duì)“對(duì)等關(guān)稅”沖擊？策略布局顯露韌性！

04-07

智駕安全風(fēng)險(xiǎn)頻發(fā)，年輕人親歷“生死瞬間”如何看？

04-07

榮耀Power輕戶(hù)外手機(jī)4月15日來(lái)襲，能否開(kāi)辟智能手機(jī)新藍(lán)海？

04-07

趙麗穎《向陽(yáng)花》豆瓣6.6分，是爭(zhēng)議還是偏見(jiàn)？

04-07

Switch 2向下兼容性如何？任天堂詳解新主機(jī)游戲兼容細(xì)節(jié)

04-07

華為新專(zhuān)利：三進(jìn)制邏輯門(mén)電路，能否引領(lǐng)芯片計(jì)算效率革命？

04-07

炫景生物Pre-A輪融資首關(guān)達(dá)成，加速推進(jìn)C3靶向siRNA藥物研發(fā)

04-07

英偉達(dá)工程師“自擺烏龍”，致AMD GPU性能下滑后迅速補(bǔ)救

04-07

谷歌Android Auto 14.0正式版上線(xiàn)，小改UI透露車(chē)機(jī)版AI新動(dòng)向

04-07

蔚來(lái)螢火蟲(chóng)小車(chē)內(nèi)飾曝光，四色可選，自在發(fā)光兩版風(fēng)格你選哪個(gè)？

04-06

比亞迪漢L、唐L即將上市，何為劃時(shí)代電動(dòng)車(chē)技術(shù)引期待

04-06

OPPO Find X8s深度體驗(yàn)：小屏旗艦的極致魅力

04-06

2025清明檔電影戰(zhàn)報(bào)：新片總票房破3億，《我的世界大電影》領(lǐng)跑！

04-06

點(diǎn)擊查看更多 +

全站最新

TMR傳感器能否終結(jié)游戲搖桿漂移問(wèn)題？

七彩虹CVN X870 ARK FROZEN V14主板發(fā)布：搭載顯卡快拆，強(qiáng)化存儲(chǔ)性能

蘋(píng)果Vision Pro 2頭顯加速量產(chǎn)，年內(nèi)上市有望成真？

商湯科技4月10日亮劍，日日新6.0 AI模型“強(qiáng)推理”能力首亮相

微軟AI版《雷神之錘2》引爭(zhēng)議：技術(shù)局限遭批，開(kāi)發(fā)者工作受質(zhì)疑

奇瑞星途凌云新增曜夜版，16.77萬(wàn)起售，高顏值高性能來(lái)襲！

熱門(mén)內(nèi)容

本欄最新

{中美AI“考生”東大入學(xué)考：英語(yǔ)超群數(shù)學(xué)短板，能否預(yù)示AI未來(lái)？）

TMR傳感器能否終結(jié)游戲搖桿漂移問(wèn)題？

七彩虹CVN X870 ARK FROZEN V14主板發(fā)布：搭載顯卡快拆，強(qiáng)化存儲(chǔ)性能

榮耀Power輕戶(hù)外手機(jī)4月15日來(lái)襲，能否開(kāi)辟智能手機(jī)新藍(lán)海？

趙麗穎《向陽(yáng)花》豆瓣6.6分，是爭(zhēng)議還是偏見(jiàn)？

Switch 2向下兼容性如何？任天堂詳解新主機(jī)游戲兼容細(xì)節(jié)

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來(lái) - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國(guó) · 北京
合作咨詢(xún) 微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類(lèi)注冊(cè)商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

{中美AI“考生”東大入學(xué)考：英語(yǔ)超群數(shù)學(xué)短板，能否預(yù)示AI未來(lái)？）

{中美AI“考生”東大入學(xué)考：英語(yǔ)超群數(shù)學(xué)短板，能否預(yù)示AI未來(lái)？）