滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界科技 > 智能手機(jī) > 正文內(nèi)容

OpenAI再奪7金，o1-preview成首個(gè)AI Kaggle特級(jí)大師！

時(shí)間：2024-10-12 21:11 來(lái)源：ITBEAR作者：柳晴雪

科技媒體The Decoder于昨日發(fā)布了一篇引人注目的報(bào)道，披露了OpenAI公司最新推出的MLE-bench基準(zhǔn)。這一基準(zhǔn)旨在評(píng)估AI智能體在開(kāi)發(fā)機(jī)器學(xué)習(xí)解決方案方面的實(shí)力，覆蓋了75個(gè)Kaggle競(jìng)賽，涵蓋了自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)和信號(hào)處理等多個(gè)領(lǐng)域。

MLE-bench專(zhuān)注于兩個(gè)核心領(lǐng)域：選擇具有挑戰(zhàn)性的任務(wù)，這些任務(wù)代表著當(dāng)前機(jī)器學(xué)習(xí)的發(fā)展前沿；比較AI與人類(lèi)的表現(xiàn)，以此評(píng)估AI在特定任務(wù)中的能力。

OpenAI在MLE-bench上測(cè)試了多個(gè)AI模型和智能體框架，其中使用AIDE框架的o1-preview模型表現(xiàn)尤為出色，在16.9%的比賽中至少獲得了一枚銅牌，這一成績(jī)甚至超越了Anthropic的Claude 3.5 Sonnet。

值得注意的是，MLE-bench上的任務(wù)具有現(xiàn)實(shí)世界的應(yīng)用價(jià)值，如預(yù)測(cè)COVID-19 mRNA疫苗的降解或解碼古代卷軸等。而獲得5枚金牌即可評(píng)為“Grandmaster”特級(jí)大師，o1-preview模型在測(cè)試中更是獲得了7枚金牌。

然而，OpenAI也承認(rèn)MLE-bench存在局限性，它并未涵蓋AI研究與開(kāi)發(fā)的所有方面，而是主要集中在那些具有明確問(wèn)題和簡(jiǎn)單評(píng)估指標(biāo)的任務(wù)上。

盡管如此，MLE-bench基準(zhǔn)的推出無(wú)疑為AI在機(jī)器學(xué)習(xí)領(lǐng)域的發(fā)展提供了新的推動(dòng)力。該基準(zhǔn)現(xiàn)已在GitHub上發(fā)布，OpenAI希望通過(guò)這一工具，進(jìn)一步推動(dòng)AI在機(jī)器學(xué)習(xí)領(lǐng)域的創(chuàng)新與應(yīng)用。

更多>同類(lèi)內(nèi)容

問(wèn)界新M7年度銷(xiāo)量領(lǐng)跑新勢(shì)力，滿電滿油綜合續(xù)航達(dá)1300公里

12-18

特斯拉上海工廠“掌舵人”宋鋼或?qū)㈦x職，新負(fù)責(zé)人已確定？

12-18

三星S24 Ultra力壓群雄，榮獲2024年讀者票選最佳手機(jī)稱(chēng)號(hào)！

12-18

東風(fēng)汽車(chē)進(jìn)軍墨西哥，十余款新能源車(chē)型齊亮相！

12-18

印度IT領(lǐng)袖力推“70小時(shí)工作制”，只為趕超中國(guó)成世界第一？

12-18

本田混動(dòng)技術(shù)革新，燃油效率飆升10%，S+換擋系統(tǒng)引領(lǐng)駕駛新體驗(yàn)

12-18

問(wèn)界M7年度交付量逼近20萬(wàn)，華為合作車(chē)型穩(wěn)居新勢(shì)力榜首

12-18

華為FreeBuds Pro 4評(píng)測(cè)：原生鴻蒙加持，音質(zhì)智能再攀高峰！

12-18

12月AppStore中國(guó)免費(fèi)榜(購(gòu)物)TOP100：抖音商城登榜首淘寶掉出前五

12-18

聯(lián)發(fā)科天璣9350芯片來(lái)襲，能否撼動(dòng)高通驍龍8s Elite中端地位？

12-18

英飛凌攜手億緯鋰能，共創(chuàng)汽車(chē)電池管理新篇章

12-18

《絕地潛兵2》熱賣(mài)！Arrowhead工作室財(cái)務(wù)穩(wěn)健，游戲開(kāi)發(fā)穩(wěn)如泰山

12-18

《星際：異端先知》爭(zhēng)議升級(jí)，頑皮狗新作女主形象顛覆玩家想象？

12-18

日汽車(chē)業(yè)巨頭醞釀大動(dòng)作：本田日產(chǎn)三菱或“抱團(tuán)”應(yīng)對(duì)市場(chǎng)變革

12-18

RTX50系列顯卡來(lái)襲，神經(jīng)渲染技術(shù)或成其獨(dú)家亮點(diǎn)？

12-18

點(diǎn)擊查看更多 +

全站最新

年輕科技旗艦愛(ài)瑪A7Plus攜“六大神技”盛大發(fā)布

榮耀Magic7 RSR保時(shí)捷版：100倍AI長(zhǎng)焦，手機(jī)秒變超級(jí)望遠(yuǎn)鏡？

小米Civi 5 Pro來(lái)襲，首發(fā)驍龍8s至尊版，徠卡影像再升級(jí)？

五菱之光EV：電動(dòng)K-Car新選擇，2025年一季度上市成“多功能新星”？

最懂年輕人的阿維塔06來(lái)了，顏值實(shí)力拉滿！

五菱宏光MINIEV四門(mén)版來(lái)襲！預(yù)訂享四重禮，新車(chē)色更吸睛

熱門(mén)內(nèi)容

本欄最新

榮耀Magic7 RSR保時(shí)捷版：100倍AI長(zhǎng)焦，手機(jī)秒變超級(jí)望遠(yuǎn)鏡？

黃仁勛獲港科大榮譽(yù)博士，抽獎(jiǎng)送4060 Ti顯卡引網(wǎng)友熱議

《英雄聯(lián)盟》動(dòng)畫(huà)《雙城之戰(zhàn)》終章來(lái)襲，創(chuàng)作者既興奮又憂結(jié)局

《英雄聯(lián)盟》雙城之戰(zhàn)第二季熱播，杰斯抉擇成最大懸念？

iQOO Neo10 系列來(lái)襲，索尼IMX921主攝加持，影像性能大升級(jí)！

C919飛機(jī)APU系統(tǒng)揚(yáng)雪試驗(yàn)成功，適航取證再進(jìn)一步！

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來(lái) / 網(wǎng)界傳媒旗下網(wǎng)站 / 中國(guó)·北京 / 合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類(lèi)注冊(cè)商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

OpenAI再奪7金，o1-preview成首個(gè)AI Kaggle特級(jí)大師！

OpenAI再奪7金，o1-preview成首個(gè)AI Kaggle特級(jí)大師！