滾動資訊

當(dāng)前位置：網(wǎng)界 > 智能出行 > 正文內(nèi)容

蘋果杜克聯(lián)手，新“交錯推理”法讓大語言模型更聰明更快！

時間：2025-05-31 07:35 作者：顧雨柔

近期，一項(xiàng)由蘋果公司與杜克大學(xué)攜手推出的創(chuàng)新強(qiáng)化學(xué)習(xí)方法“交錯推理”，在人工智能領(lǐng)域掀起了波瀾。該方法旨在顯著增強(qiáng)大語言模型的推理能力，為復(fù)雜問題的解決提供了新的視角。

在探討這一突破之前，我們不得不提及當(dāng)前大語言模型在處理多步驟復(fù)雜問題時所面臨的挑戰(zhàn)。它們往往遵循一種線性的“思考-回答”模式，雖然邏輯清晰，但響應(yīng)速度較慢，且在推理鏈的任一環(huán)節(jié)出錯都可能影響最終答案的準(zhǔn)確性。這種模式與人類的交流方式大相徑庭，人類傾向于在思考過程中逐步表達(dá)想法，而模型則傾向于在完成整個推理后才給出答案，這在一定程度上限制了其效率和互動性。

為了打破這一僵局，“交錯推理”應(yīng)運(yùn)而生。該方法的核心在于，在模型的推理過程中，巧妙地交替進(jìn)行內(nèi)部計算和輸出中間答案的操作，從而大幅提升響應(yīng)速度和實(shí)用性。為了實(shí)現(xiàn)這一目標(biāo)，研究團(tuán)隊(duì)設(shè)計了一個基于強(qiáng)化學(xué)習(xí)的訓(xùn)練框架，其中嵌入了特定的指示標(biāo)簽，這些標(biāo)簽?zāi)軌蛞龑?dǎo)模型在達(dá)到關(guān)鍵推理節(jié)點(diǎn)時輸出階段性成果。

為了確保模型在追求局部輸出效率的同時，不犧牲整體推理的準(zhǔn)確性，研究團(tuán)隊(duì)精心構(gòu)建了一套基于規(guī)則的獎勵機(jī)制。該機(jī)制綜合考慮了格式合規(guī)性、最終準(zhǔn)確率以及條件性中間準(zhǔn)確率等多個維度，以確保模型在推理過程中的每一步都能得到恰當(dāng)?shù)募睢?/p>

實(shí)驗(yàn)數(shù)據(jù)表明，“交錯推理”在Qwen2.5模型（包括1.5B和7B參數(shù)版本）上取得了顯著成效。與傳統(tǒng)方法相比，該方法的響應(yīng)速度提升了超過80%，推理準(zhǔn)確率也提高了近19.3%。更令人振奮的是，盡管模型僅在問答類和邏輯類數(shù)據(jù)集上進(jìn)行了訓(xùn)練，但它在MATH、GPQA和MMLU等更具挑戰(zhàn)性的任務(wù)中也展現(xiàn)出了強(qiáng)大的泛化能力。

研究團(tuán)隊(duì)還嘗試了多種獎勵機(jī)制，包括全或無獎勵、部分積分獎勵及時間折扣獎勵等。結(jié)果顯示，條件性獎勵和時間折扣獎勵的效果最為突出，遠(yuǎn)遠(yuǎn)超越了傳統(tǒng)訓(xùn)練方式。

“交錯推理”的提出，不僅為提升大語言模型在復(fù)雜推理任務(wù)中的表現(xiàn)提供了一條切實(shí)可行的技術(shù)路徑，也為未來模型的設(shè)計與優(yōu)化提供了新的思路。這一創(chuàng)新成果無疑將推動人工智能領(lǐng)域向更加高效、智能的方向發(fā)展。

更多>同類內(nèi)容

誰是中國投資界的“高盛”？中金能否扛起這面大旗？

08-12

A股震蕩上行，鋰礦鏈條成焦點(diǎn)，本輪上漲背后有何驅(qū)動與機(jī)遇？

08-12

2025歐美葡萄酒市場新趨勢，賀蘭山東麓酒莊能否跟上節(jié)奏？

08-11

高盛微調(diào)中芯國際盈測，2027年前每股略降，目標(biāo)價仍看63.7港元

08-11

關(guān)稅重壓下，美國餐飲業(yè)何去何從？老牌餐廳深陷困境

08-11

伊利國際化實(shí)踐再獲權(quán)威認(rèn)證，潘剛“互惠共贏”理念引領(lǐng)全球發(fā)展

08-11

鈞崴電子26億日元并購日本企業(yè)，加速布局薄膜電阻領(lǐng)域

08-11

黃金閃崩，多空激戰(zhàn)3400點(diǎn)保衛(wèi)戰(zhàn)，后市走向何方？

08-11

山金國際董秘詳解港股發(fā)行、新礦投產(chǎn)及財務(wù)狀況

08-11

Crocs跌落神壇：洞洞鞋失寵，美國人真的不買了？

08-10

世運(yùn)電路股東新豪國際計劃減持，減持套現(xiàn)金額或超6.9億

08-10

嘉誠國際8年路：歸母凈利潤大增七成，市值距巔峰跌去近三成

08-08

劉強(qiáng)東185億布局歐洲，京東能否借此重塑零售生態(tài)？

08-05

我國2噸級eVTOL首次實(shí)現(xiàn)海上石油平臺物資運(yùn)輸飛行突破！

08-04

梅卡曼德：具身智能引領(lǐng)工業(yè)革新，助力全球工業(yè)邁向新高度

08-04

點(diǎn)擊查看更多 +

全站最新

商務(wù)部調(diào)整涉美實(shí)體出口管制與不可靠實(shí)體清單措施

德媒指責(zé)中國稀土管控：真相是依賴下的焦慮還是環(huán)保的呼喚？

誰是中國投資界的“高盛”？中金能否扛起這面大旗？

美股微漲迎數(shù)據(jù)周，7月CPI成降息關(guān)鍵？

探尋“中國版高盛”：中金公司并購重組之路

蘭特黎斯或?qū)⒔邮趾闾烊?00億消費(fèi)品業(yè)務(wù)，中國市場成特例

熱門內(nèi)容

本欄最新

誰是中國投資界的“高盛”？中金能否扛起這面大旗？

2025歐美葡萄酒市場新趨勢，賀蘭山東麓酒莊能否跟上節(jié)奏？

關(guān)稅重壓下，美國餐飲業(yè)何去何從？老牌餐廳深陷困境

鈞崴電子26億日元并購日本企業(yè)，加速布局薄膜電阻領(lǐng)域

黃金閃崩，多空激戰(zhàn)3400點(diǎn)保衛(wèi)戰(zhàn)，后市走向何方？

山金國際董秘詳解港股發(fā)行、新礦投產(chǎn)及財務(wù)狀況

網(wǎng)界 - 新財經(jīng) 新科技新未來 - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國 · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

蘋果杜克聯(lián)手，新“交錯推理”法讓大語言模型更聰明更快！

蘋果杜克聯(lián)手，新“交錯推理”法讓大語言模型更聰明更快！