近期,英國廣播公司(BBC)公布了一項(xiàng)關(guān)于人工智能(AI)聊天機(jī)器人在新聞總結(jié)方面能力的深度研究結(jié)果,引發(fā)廣泛關(guān)注。此次研究涉及了多家知名AI工具,包括微軟的Copilot、OpenAI的ChatGPT、谷歌的Gemini以及Perplexity等。
在這項(xiàng)研究中,BBC選取了100篇新聞報道,要求這些AI工具對它們進(jìn)行總結(jié),并根據(jù)總結(jié)內(nèi)容提出相關(guān)問題。然而,研究結(jié)果卻揭示了AI在新聞總結(jié)方面的嚴(yán)重準(zhǔn)確性問題。超過一半的AI生成的答案存在顯著問題,其中約五分之一的答案甚至引入了明顯的事實(shí)錯誤,包括數(shù)據(jù)、陳述和日期等關(guān)鍵信息的誤導(dǎo)。
BBC新聞與時事首席執(zhí)行官德博拉?特內(nèi)斯對此表示擔(dān)憂,她指出:“當(dāng)AI助手引用BBC文章內(nèi)容時,超過十分之一的‘引文’被篡改或根本不存在于原文中。”這不僅影響了信息的準(zhǔn)確性,更可能對讀者的認(rèn)知產(chǎn)生誤導(dǎo)。
研究還發(fā)現(xiàn)AI助手在新聞總結(jié)過程中存在其他問題。它們難以區(qū)分事實(shí)與觀點(diǎn),無法辨別新聞報道中的即時信息與歷史存檔信息,且在給出答案時容易摻入主觀觀點(diǎn)。特內(nèi)斯強(qiáng)調(diào):“這些AI工具所生成的結(jié)果往往問題重重,與消費(fèi)者所期望的經(jīng)過驗(yàn)證的事實(shí)和清晰表述相去甚遠(yuǎn)?!?/p>
值得注意的是,微軟的Copilot和谷歌的Gemini在處理新聞總結(jié)時表現(xiàn)出的問題更為復(fù)雜。與ChatGPT和Perplexity相比,它們在區(qū)分觀點(diǎn)與事實(shí)、編輯化處理以及遺漏關(guān)鍵背景信息方面表現(xiàn)欠佳。這一發(fā)現(xiàn)進(jìn)一步凸顯了AI在新聞總結(jié)方面的局限性和挑戰(zhàn)。
實(shí)際上,AI工具的準(zhǔn)確性問題并非僅限于新聞總結(jié)領(lǐng)域。近期,蘋果公司也因旗下Apple Intelligence通知工具分享錯誤標(biāo)題而引發(fā)爭議,該功能因此被暫時停用,并受到新聞機(jī)構(gòu)和自由團(tuán)體的批評。這些事件再次提醒我們,AI技術(shù)在應(yīng)用過程中仍需謹(jǐn)慎對待。
鑒于AI在新聞總結(jié)方面存在的問題,BBC呼吁在與AI服務(wù)提供商進(jìn)行深入對話并找到解決方案之前,應(yīng)暫停使用AI生成的新聞總結(jié)。特內(nèi)斯表示:“我們希望通過合作,共同尋找解決之道,以確保信息的準(zhǔn)確性和可靠性?!?/p>