滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 數(shù)據(jù)洞察 > 正文內(nèi)容

AI搜索工具準(zhǔn)確率堪憂(yōu)，六成答案不準(zhǔn)確卻“自信滿(mǎn)滿(mǎn)”？

時(shí)間：2025-03-13 17:42 作者：顧雨柔

近期，哥倫比亞大學(xué)數(shù)字新聞研究中心公布了一項(xiàng)針對(duì)AI搜索引擎的深度研究報(bào)告，引起了廣泛關(guān)注。該研究聚焦于當(dāng)前市面上八款主流的AI搜索工具，包括ChatGPT Search、Perplexity系列、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search以及Copilot，旨在通過(guò)一系列嚴(yán)格測(cè)試評(píng)估它們的準(zhǔn)確性和可靠性。

研究人員精心挑選了來(lái)自20家新聞機(jī)構(gòu)的200篇報(bào)道作為測(cè)試樣本，確保這些報(bào)道在谷歌搜索結(jié)果中排名靠前。隨后，他們利用相同的查詢(xún)語(yǔ)句，逐一測(cè)試這些AI搜索工具的表現(xiàn)，重點(diǎn)關(guān)注它們能否正確引用文章內(nèi)容、新聞機(jī)構(gòu)名稱(chēng)及原始鏈接。

測(cè)試結(jié)果顯示，除了Perplexity及其付費(fèi)版本外，其余AI搜索引擎的表現(xiàn)均不盡人意?？傮w而言，AI搜索引擎給出的答案中，有高達(dá)60%是不準(zhǔn)確的。更令人擔(dān)憂(yōu)的是，這些AI工具對(duì)于錯(cuò)誤答案的“自信”態(tài)度，使得問(wèn)題進(jìn)一步惡化。它們往往以不容置疑的口吻陳述錯(cuò)誤信息，甚至在受到質(zhì)疑時(shí)，仍試圖通過(guò)邏輯自洽來(lái)維護(hù)其答案的正確性。

這項(xiàng)研究不僅揭示了AI搜索引擎在準(zhǔn)確性方面的不足，更引發(fā)了業(yè)界對(duì)于大語(yǔ)言模型可靠性的深刻反思。長(zhǎng)期以來(lái)，人們一直擔(dān)心大語(yǔ)言模型可能會(huì)一本正經(jīng)地胡說(shuō)八道，而此次研究的數(shù)據(jù)結(jié)果無(wú)疑為這一擔(dān)憂(yōu)提供了有力佐證。這些AI工具在陳述錯(cuò)誤信息時(shí)，往往表現(xiàn)得非常自信，這無(wú)疑增加了用戶(hù)誤信錯(cuò)誤信息的風(fēng)險(xiǎn)。

ChatGPT Search雖然回答了所有200個(gè)新聞查詢(xún)，但其“完全正確”率僅為28%，而“完全錯(cuò)誤”率則高達(dá)57%。盡管表現(xiàn)不佳，但ChatGPT Search并非墊底。X公司旗下的Grok AI系列表現(xiàn)更為糟糕，其中Grok-3 Search的錯(cuò)誤率更是驚人地達(dá)到了94%。而微軟Copilot也問(wèn)題頻出，在200次查詢(xún)中，有104次拒絕回答，剩下的回答中，正確率也僅為16%，總體錯(cuò)誤率接近70%。

令人驚訝的是，盡管這些AI搜索工具存在諸多問(wèn)題，但它們的開(kāi)發(fā)公司仍在向用戶(hù)收取高額的訂閱費(fèi)用，每月費(fèi)用從20美元至200美元不等。更令人費(fèi)解的是，付費(fèi)版Perplexity Pro和Grok-3 Search雖然回答次數(shù)更多，但錯(cuò)誤率也隨之上升。這一現(xiàn)象無(wú)疑引發(fā)了用戶(hù)對(duì)于AI搜索工具性?xún)r(jià)比的質(zhì)疑。

此次研究揭示了當(dāng)前AI搜索引擎在準(zhǔn)確性和可靠性方面存在的問(wèn)題和挑戰(zhàn)。隨著AI技術(shù)的不斷發(fā)展，我們期待未來(lái)能夠看到更加準(zhǔn)確、可靠的AI搜索工具問(wèn)世，為用戶(hù)提供更加優(yōu)質(zhì)的信息服務(wù)。

更多>同類(lèi)內(nèi)容

英特爾新CEO陳立武：全力打造世界一流產(chǎn)品公司與代工廠！

03-13

JR西日本將建3D打印火車(chē)站，6小時(shí)速成不影響運(yùn)營(yíng)

03-13

肖戰(zhàn)維權(quán)成功！多名黑粉被判道歉并賠償

03-13

廣東順風(fēng)車(chē)監(jiān)管升級(jí)：營(yíng)運(yùn)車(chē)輛被禁接單，順風(fēng)車(chē)還能順嗎？

03-13

量子網(wǎng)絡(luò)新紀(jì)元：全球首個(gè)量子網(wǎng)絡(luò)操作系統(tǒng)QNodeOS誕生

03-13

雷迪克新設(shè)機(jī)器人公司，含AI業(yè)務(wù)

APP顯示，近日，浙江雷鳴機(jī)器人有限公司成立，法定代表人為沈仁榮，注冊(cè)資本1億元，經(jīng)營(yíng)范圍包含：智能機(jī)器人的研發(fā)；人工智能行業(yè)應(yīng)用系統(tǒng)集成服務(wù)；人工智能硬件銷(xiāo)售；微特電機(jī)及組件制造等。股權(quán)穿透顯示…

03-13

日海智能新成立技術(shù)子公司，經(jīng)營(yíng)范圍涵蓋衛(wèi)星遙感等多元領(lǐng)域

03-13

中煤能源于田布局新能源，新公司注冊(cè)資本超8億，業(yè)務(wù)涵蓋太陽(yáng)能發(fā)電

03-13

LG OLED evo C5系列電視上架，42至77英寸多種選擇，性能大提升！

03-13

吉利系整合新進(jìn)展！領(lǐng)克員工遷址杭州極氪大廈，聯(lián)合辦公成現(xiàn)實(shí)

03-13

德賽電池勞務(wù)輿情引關(guān)注，惠州仲愷高新區(qū)管委會(huì)迅速介入調(diào)查

03-13

微軟3月安全更新：六大高危漏洞被修復(fù)，你的電腦安全了嗎？

03-13

中國(guó)印鈔造幣集團(tuán)嚴(yán)正聲明：從未參與虛擬貨幣發(fā)售，謹(jǐn)防假冒！

03-13

中國(guó)印鈔造幣集團(tuán)嚴(yán)正聲明：未涉足虛擬貨幣，公眾謹(jǐn)防被騙！

03-13

《蒼藍(lán)避風(fēng)港》來(lái)襲！《戰(zhàn)艦少女R》續(xù)作，移動(dòng)端新冒險(xiǎn)即將開(kāi)啟

03-13

點(diǎn)擊查看更多 +

全站最新

特斯拉董事默多克拋售股票，套現(xiàn)近億元，股價(jià)連跌四周散戶(hù)何去何從？

英特爾新CEO陳立武：全力打造世界一流產(chǎn)品公司與代工廠！

JR西日本將建3D打印火車(chē)站，6小時(shí)速成不影響運(yùn)營(yíng)

豐田皇冠家族新成員：Estate中型SUV日本震撼登場(chǎng)！

華為智慧屏S6 Pro來(lái)襲：超薄零貼墻設(shè)計(jì)，全家共享“巨幕手機(jī)”新體驗(yàn)

OPPO ColorOS 15三月大升級(jí)：AI語(yǔ)音識(shí)別等新功能來(lái)襲！

熱門(mén)內(nèi)容

本欄最新

JR西日本將建3D打印火車(chē)站，6小時(shí)速成不影響運(yùn)營(yíng)

肖戰(zhàn)維權(quán)成功！多名黑粉被判道歉并賠償

廣東順風(fēng)車(chē)監(jiān)管升級(jí)：營(yíng)運(yùn)車(chē)輛被禁接單，順風(fēng)車(chē)還能順嗎？

量子網(wǎng)絡(luò)新紀(jì)元：全球首個(gè)量子網(wǎng)絡(luò)操作系統(tǒng)QNodeOS誕生

雷迪克新設(shè)機(jī)器人公司，含AI業(yè)務(wù)

日海智能新成立技術(shù)子公司，經(jīng)營(yíng)范圍涵蓋衛(wèi)星遙感等多元領(lǐng)域

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來(lái) - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國(guó) · 北京
合作咨詢(xún) 微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類(lèi)注冊(cè)商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

AI搜索工具準(zhǔn)確率堪憂(yōu)，六成答案不準(zhǔn)確卻“自信滿(mǎn)滿(mǎn)”？

AI搜索工具準(zhǔn)確率堪憂(yōu)，六成答案不準(zhǔn)確卻“自信滿(mǎn)滿(mǎn)”？