滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 產(chǎn)業(yè)經(jīng)濟(jì) > 正文內(nèi)容

豆包大模型開(kāi)源Multi-SWE-bench，多語(yǔ)言“自動(dòng)修Bug”能力能否更上一層樓？

時(shí)間：2025-04-10 18:34 作者：馮璃月

字節(jié)跳動(dòng)旗下的豆包大模型團(tuán)隊(duì)近日傳來(lái)重要消息，他們正式推出了首個(gè)多語(yǔ)言軟件錯(cuò)誤修正（SWE）數(shù)據(jù)集——Multi-SWE-bench。這一創(chuàng)新工具旨在評(píng)估和提升大型語(yǔ)言模型在自動(dòng)修復(fù)代碼錯(cuò)誤方面的能力。

Multi-SWE-bench是在原有SWE-bench的基礎(chǔ)上拓展而來(lái)，其最大亮點(diǎn)在于覆蓋了除Python外的七種主流編程語(yǔ)言，包括Java、Go、Rust、C、C++、Type以及再次提及的Java（此處原文可能有誤，或?yàn)槠渌Z(yǔ)言，如Typescript，但為保持原文信息完整性，按原文轉(zhuǎn)述）。這一數(shù)據(jù)集真正實(shí)現(xiàn)了面向“全棧工程”的評(píng)測(cè)基準(zhǔn)，為開(kāi)發(fā)者提供了更為全面的評(píng)估工具。

據(jù)悉，Multi-SWE-bench共包含1632個(gè)實(shí)例，這些實(shí)例均源自GitHub上的issue，且經(jīng)過(guò)嚴(yán)格的測(cè)試標(biāo)準(zhǔn)和專業(yè)開(kāi)發(fā)者的精心篩選。每個(gè)樣本都確保了問(wèn)題描述的清晰性、修復(fù)補(bǔ)丁的正確性以及可復(fù)現(xiàn)的運(yùn)行測(cè)試環(huán)境，從而保證了數(shù)據(jù)集的高質(zhì)量。

豆包大模型團(tuán)隊(duì)表示，他們希望Multi-SWE-bench能夠成為大型語(yǔ)言模型在多種主流編程語(yǔ)言與真實(shí)代碼環(huán)境中的系統(tǒng)性評(píng)測(cè)基準(zhǔn)。這一工具將推動(dòng)自動(dòng)編程能力向更加實(shí)用、更加工程化的方向發(fā)展，為開(kāi)發(fā)者帶來(lái)實(shí)質(zhì)性的幫助。

與以往主要聚焦于Python單語(yǔ)言任務(wù)的數(shù)據(jù)集相比，Multi-SWE-bench更加貼近現(xiàn)實(shí)中的多語(yǔ)言開(kāi)發(fā)場(chǎng)景。它不僅能夠更準(zhǔn)確地反映當(dāng)前模型在“自動(dòng)化軟件工程”方向上的實(shí)際能力邊界，還為開(kāi)發(fā)者提供了更為全面、更為實(shí)用的評(píng)測(cè)工具。

更多>同類內(nèi)容

晶圓代工巨頭3月?tīng)I(yíng)收大漲46.5%，87億美元?jiǎng)?chuàng)佳績(jī)！

04-10

國(guó)產(chǎn)化新突破！首臺(tái)苯乙烯三聯(lián)換熱裝備核心蒸發(fā)器制造完工

04-10

國(guó)債開(kāi)售引搶購(gòu)熱潮，2025年首批電子式儲(chǔ)蓄國(guó)債多家銀行額度秒光！

04-10

vivo WATCH 5亮相：藍(lán)河系統(tǒng)+22天續(xù)航，智能手表新升級(jí)？

04-10

摩托羅拉Edge 60 Stylus現(xiàn)身跑分庫(kù)，搭載驍龍7s Gen 2性能如何？

04-10

零跑汽車大動(dòng)作：智駕軟件全免費(fèi)，付費(fèi)用戶將獲退款，三電質(zhì)保全覆蓋

04-10

索尼ULT FIELD系列藍(lán)牙音箱：炫彩燈效加持，重低音體驗(yàn)再升級(jí)！

04-10

《網(wǎng)絡(luò)交易合規(guī)數(shù)據(jù)報(bào)送管理暫行辦法》專家解讀：中治律師事務(wù)所執(zhí)行主任任鴻雁

04-10

摩托羅拉新機(jī)爆料：驍龍8至尊版小折疊來(lái)襲，Edge系列將重返國(guó)內(nèi)市場(chǎng)？

04-10

Asahi驅(qū)動(dòng)UAPI入駐Linux內(nèi)核，蘋(píng)果M系列芯片圖形支持取得新進(jìn)展

04-10

金圓股份實(shí)控人離婚，4.2億財(cái)產(chǎn)分割引關(guān)注，公司未來(lái)發(fā)展何去何從？

04-10

短劇推廣兼職真相：賺錢神話還是層層套路？

04-10

四川新荷花中藥飲片公司，15年四次IPO之路，港交所能否成最終站？

04-10

藍(lán)廠最強(qiáng)直屏旗艦vivo X200s：6200mAh大電池，安卓蘋(píng)果生態(tài)無(wú)縫切換？

04-10

寶馬摩托新車亮相2025北京展：探險(xiǎn)復(fù)古齊上陣，旗艦ADV首秀引期待

04-10

點(diǎn)擊查看更多 +

全站最新

一加Ace 6系列將首發(fā)高通新平臺(tái)：SM8845基于3nm工藝，性能強(qiáng)勁

馬云現(xiàn)身阿里云園區(qū)，身穿15周年紀(jì)念衫工牌“風(fēng)清揚(yáng)”搶鏡

晶圓代工巨頭3月?tīng)I(yíng)收大漲46.5%，87億美元?jiǎng)?chuàng)佳績(jī)！

漫步者花再Zero Clip耳夾耳機(jī)新增玫瑰金配色，售價(jià)359元開(kāi)售！

Ubuntu 25.04版將JPEG-XL設(shè)為默認(rèn)圖像格式，用戶無(wú)需再手動(dòng)配置

機(jī)械師Lancer68 Pro鍵盤(pán)預(yù)約開(kāi)啟，全鋁CNC機(jī)身，高靈敏度體驗(yàn)僅需429元起

熱門內(nèi)容

本欄最新

豆包大模型開(kāi)源Multi-SWE-bench，多語(yǔ)言“自動(dòng)修Bug”能力能否更上一層樓？

晶圓代工巨頭3月?tīng)I(yíng)收大漲46.5%，87億美元?jiǎng)?chuàng)佳績(jī)！

國(guó)產(chǎn)化新突破！首臺(tái)苯乙烯三聯(lián)換熱裝備核心蒸發(fā)器制造完工

國(guó)債開(kāi)售引搶購(gòu)熱潮，2025年首批電子式儲(chǔ)蓄國(guó)債多家銀行額度秒光！

vivo WATCH 5亮相：藍(lán)河系統(tǒng)+22天續(xù)航，智能手表新升級(jí)？

摩托羅拉Edge 60 Stylus現(xiàn)身跑分庫(kù)，搭載驍龍7s Gen 2性能如何？

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來(lái) - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國(guó) · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊(cè)商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

豆包大模型開(kāi)源Multi-SWE-bench，多語(yǔ)言“自動(dòng)修Bug”能力能否更上一層樓？

豆包大模型開(kāi)源Multi-SWE-bench，多語(yǔ)言“自動(dòng)修Bug”能力能否更上一層樓？