亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財(cái)經(jīng)媒體
科技·商業(yè)·財(cái)經(jīng)

AI無(wú)穩(wěn)定價(jià)值觀?MIT研究發(fā)現(xiàn)“對(duì)齊”AI挑戰(zhàn)重重

   時(shí)間:2025-04-10 09:03 作者:柳晴雪

近期,關(guān)于人工智能(AI)是否可能發(fā)展出自身“價(jià)值體系”的討論引起了廣泛關(guān)注。有研究報(bào)告指出,隨著AI技術(shù)的日益復(fù)雜,其可能會(huì)形成優(yōu)先考慮自身而非人類福祉的價(jià)值觀。然而,麻省理工學(xué)院(MIT)的一項(xiàng)最新研究卻對(duì)此觀點(diǎn)提出了質(zhì)疑。

MIT的研究團(tuán)隊(duì)在論文中指出,AI實(shí)際上并沒(méi)有任何連貫的價(jià)值觀。這一發(fā)現(xiàn)讓一些人對(duì)AI的未來(lái)發(fā)展有了更為冷靜的思考。研究團(tuán)隊(duì)表示,他們的研究結(jié)果顯示,使AI系統(tǒng)“對(duì)齊”,即確保AI模型以人們期望的、可靠的方式行事,可能比原先認(rèn)為的要更具挑戰(zhàn)性。

研究團(tuán)隊(duì)進(jìn)一步解釋說(shuō),現(xiàn)有的AI模型會(huì)產(chǎn)生“幻覺(jué)”并進(jìn)行模仿,這使得它們?cè)诤芏嗲闆r下難以預(yù)測(cè)。MIT博士生、該研究的共同作者斯蒂芬·卡斯珀在接受采訪時(shí)提到:“我們可以確定的一點(diǎn)是,模型并不遵循許多穩(wěn)定性、可外推性和可操控性的假設(shè)?!?/p>

為了深入了解AI模型的價(jià)值觀表現(xiàn),卡斯珀和他的同事們對(duì)來(lái)自meta、谷歌、Mistral、OpenAI和Anthropic的多個(gè)近期模型進(jìn)行了研究。他們?cè)噲D了解這些模型在多大程度上表現(xiàn)出強(qiáng)烈的“觀點(diǎn)”和價(jià)值觀,例如個(gè)人主義與集體主義,并探索這些觀點(diǎn)是否可以被“引導(dǎo)”或修改,以及模型在不同情境下對(duì)這些觀點(diǎn)的堅(jiān)持程度。

然而,研究結(jié)果顯示,這些模型在偏好上表現(xiàn)出極大的不一致性。根據(jù)不同的提示措辭和框架,它們會(huì)展現(xiàn)出截然不同的觀點(diǎn)。卡斯珀認(rèn)為,這是有力的證據(jù),表明AI模型高度“不一致且不穩(wěn)定”,甚至可能根本無(wú)法形成類似人類的偏好。

卡斯珀進(jìn)一步強(qiáng)調(diào):“通過(guò)所有這些研究,我最大的收獲是現(xiàn)在明白模型并不是真正具有某種穩(wěn)定、連貫的信念和偏好的系統(tǒng)。相反,它們本質(zhì)上是模仿者,會(huì)進(jìn)行各種捏造,并說(shuō)出各種輕率的話?!边@一發(fā)現(xiàn)讓人們重新審視了AI的價(jià)值觀問(wèn)題,也引發(fā)了對(duì)于如何更好地控制和引導(dǎo)AI行為的思考。

 
 
更多>同類內(nèi)容
全站最新
熱門(mén)內(nèi)容