亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財(cái)經(jīng)媒體
科技·商業(yè)·財(cái)經(jīng)

OpenAI ChatGPT新技能Deep Research:深度搜索,打造互聯(lián)網(wǎng)新界面

   時(shí)間:2025-02-03 16:06 來(lái)源:ITBEAR作者:趙云飛

OpenAI近日突如其來(lái)地宣布了一項(xiàng)重大更新,通過(guò)一場(chǎng)緊急安排的小型發(fā)布會(huì),向全球展示了其最新研發(fā)成果——Deep Research功能。這一功能在發(fā)布會(huì)前4小時(shí)方才通知,而直播活動(dòng)則于晚上8點(diǎn)準(zhǔn)時(shí)開(kāi)啟,引起了業(yè)界的廣泛關(guān)注。

Deep Research被設(shè)計(jì)為能夠執(zhí)行復(fù)雜研究任務(wù),據(jù)OpenAI介紹,它能夠在短短數(shù)十分鐘內(nèi)完成人類專家通常需要數(shù)小時(shí)才能完成的工作。這一功能在“人類最后的考試”中表現(xiàn)出色,刷新了最高分記錄,其推理設(shè)置分?jǐn)?shù)甚至高出之前的o3-mini一倍之多。該測(cè)試涵蓋了從語(yǔ)言學(xué)到生態(tài)學(xué)等100多個(gè)主題,包括3000多個(gè)多選和簡(jiǎn)答題。

在另一項(xiàng)名為GAIA的現(xiàn)實(shí)世界問(wèn)題評(píng)估基準(zhǔn)測(cè)試中,Deep Research同樣表現(xiàn)卓越,刷新了三個(gè)難度級(jí)別的記錄。不過(guò),出于保護(hù)基準(zhǔn)測(cè)試的目的,OpenAI僅展示了Deep Research在完成任務(wù)時(shí)的搜索過(guò)程,而隱去了最終答案。

Deep Research功能將首先對(duì)OpenAI的Pro、Plus和Team用戶開(kāi)放。據(jù)透露,目前版本基于o3構(gòu)建,Plus用戶(每月20美元)每月可使用約10次該功能,同時(shí)OpenAI正在構(gòu)建一個(gè)更高效的版本。免費(fèi)用戶也將獲得極為有限的使用額度。

Deep Research專為金融、科學(xué)、工程等領(lǐng)域的高強(qiáng)度知識(shí)工作者設(shè)計(jì),他們需要深入、精確且可靠的研究。該功能由OpenAI o3驅(qū)動(dòng),通過(guò)基于真實(shí)任務(wù)(涉及瀏覽器和Python工具的使用)的訓(xùn)練,采用了與o1相同的強(qiáng)化學(xué)習(xí)方法。用戶只需給出一個(gè)提示,Deep Research便會(huì)查找、分析并整合數(shù)百個(gè)在線資源,生成一份達(dá)到研究分析師水平的綜合報(bào)告。

OpenAI表示,Deep Research標(biāo)志著他們?cè)陂_(kāi)發(fā)通用人工智能(AGI)的宏偉目標(biāo)上邁出了重要一步。他們長(zhǎng)期以來(lái)一直設(shè)想AGI能夠進(jìn)行新穎的科學(xué)研究,而Deep Research正是這一愿景的重要進(jìn)展。

OpenAI還透露,接下來(lái)幾周內(nèi),他們將為這些報(bào)告添加嵌入式圖片、數(shù)據(jù)可視化和其它分析輸出。與GPT-4o等相比,Deep Research能夠針對(duì)需要深度和細(xì)節(jié)的多方面、特定領(lǐng)域問(wèn)題進(jìn)行廣泛探索,并引用每個(gè)觀點(diǎn)。

然而,OpenAI也指出了Deep Research存在的局限性。有時(shí),它可能會(huì)在回復(fù)中產(chǎn)生事實(shí)幻覺(jué)或做出錯(cuò)誤的推斷,盡管根據(jù)內(nèi)部評(píng)估,其錯(cuò)誤率明顯低于現(xiàn)有的ChatGPT模型。它在區(qū)分權(quán)威信息和謠言方面可能遇到困難,并且在自信度校準(zhǔn)方面目前表現(xiàn)出弱點(diǎn),常常無(wú)法準(zhǔn)確傳達(dá)不確定性。報(bào)告和引用中可能會(huì)有輕微的格式錯(cuò)誤,并且啟動(dòng)任務(wù)可能需要更長(zhǎng)的時(shí)間。

OpenAI計(jì)劃在本月內(nèi)將Deep Research功能推送到移動(dòng)和桌面App端。目前,Deep Research可以訪問(wèn)公開(kāi)網(wǎng)絡(luò)和上傳的文件,未來(lái)將能夠連接到更多專業(yè)化的數(shù)據(jù)源,使其輸出更加穩(wěn)健和個(gè)性化。他們預(yù)見(jiàn)ChatGPT將實(shí)現(xiàn)Agent體驗(yàn)的融合,用于異步、現(xiàn)實(shí)世界的研發(fā)和執(zhí)行。Deep Research(可進(jìn)行異步在線調(diào)查)與Operator(可進(jìn)行現(xiàn)實(shí)行動(dòng))的結(jié)合,將使ChatGPT能夠執(zhí)行越來(lái)越復(fù)雜的任務(wù)。

OpenAI研究員Jason Wei分享了他對(duì)這項(xiàng)新研究的看法。他認(rèn)為,Deep Research不僅是出色的Agent,也可以看成是互聯(lián)網(wǎng)的新界面。人類使用互聯(lián)網(wǎng)需要大量時(shí)間來(lái)搜索和點(diǎn)擊,受到時(shí)間和注意力的限制。而AI永遠(yuǎn)不會(huì)累,一次可以瀏覽許多網(wǎng)站,并擁有幾乎無(wú)限的世界知識(shí)。他預(yù)測(cè),將來(lái)通過(guò)瀏覽器手動(dòng)瀏覽互聯(lián)網(wǎng)將過(guò)時(shí),就像手動(dòng)計(jì)算數(shù)字而不使用計(jì)算器一樣。

OpenAI toG業(yè)務(wù)負(fù)責(zé)人Felipe Millon則分享了一個(gè)個(gè)人故事。他的妻子被診斷出患有雙側(cè)乳腺癌,在是否應(yīng)該接受放療的問(wèn)題上遇到了困惑。不同的專家給出了不同的建議。Millon利用自己在OpenAI獲得的Deep Research測(cè)試權(quán)限,上傳了手術(shù)報(bào)告并詢問(wèn)ChatGPT的建議。ChatGPT不僅證實(shí)了人類專家提到的內(nèi)容,還搜索出了全新的參考研究。Millon認(rèn)為,這是一個(gè)將改變世界的工具。

也有少數(shù)第三方團(tuán)隊(duì)提前獲得了Deep Research的測(cè)試資格,并在發(fā)布會(huì)上分享了測(cè)試結(jié)果。Every團(tuán)隊(duì)介紹稱,一些問(wèn)題需要花費(fèi)30分鐘才能得到結(jié)果,答案可能超過(guò)1萬(wàn)個(gè)單詞。他們所做的測(cè)試包括撰寫從2020年至今每天的歷史、分析《戰(zhàn)爭(zhēng)與和平》中托爾斯泰的人物描寫、仔細(xì)查閱近期的財(cái)務(wù)報(bào)告以發(fā)現(xiàn)違規(guī)行為等。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容