近期,百度科研團(tuán)隊(duì)在學(xué)術(shù)界權(quán)威平臺(tái)arXiv上發(fā)布了一篇全新論文,揭示了一項(xiàng)名為COBRA的創(chuàng)新算法框架,該框架旨在優(yōu)化廣告推薦系統(tǒng)中生成式模型的應(yīng)用效果。
據(jù)論文詳細(xì)闡述,COBRA框架在真實(shí)商業(yè)環(huán)境中的A/B測(cè)試表現(xiàn)尤為亮眼,轉(zhuǎn)化率顯著提升3.6%,平均每用戶收入(ARPU)也實(shí)現(xiàn)了4.15%的增長(zhǎng)。這一成果無疑為廣告推薦領(lǐng)域帶來了新的突破。
百度已將COBRA框架成功融入其廣告推薦業(yè)務(wù)的核心流程中,進(jìn)一步提升了服務(wù)的精準(zhǔn)度和用戶滿意度。該框架的核心優(yōu)勢(shì)在于,它巧妙融合了生成式技術(shù)和密集檢索技術(shù),通過稀疏ID與稠密向量的雙重作用,為目標(biāo)對(duì)象提供了更為詳盡和豐富的特征描述。
在這一框架下,稀疏ID扮演著穩(wěn)定類別基礎(chǔ)信息的角色,而稠密向量則以其強(qiáng)大的捕捉能力,精準(zhǔn)地把握了高級(jí)語(yǔ)義和細(xì)粒度細(xì)節(jié)。這種創(chuàng)新的端到端訓(xùn)練方法,不僅有效捕捉了用戶的真實(shí)意圖,還實(shí)現(xiàn)了協(xié)同信息的深度挖掘。
技術(shù)層面,百度團(tuán)隊(duì)引入了“殘差量化變分自編碼器(RQ-VAE)”這一前沿技術(shù),將殘差學(xué)習(xí)、量化技術(shù)和變分自編碼器三者有機(jī)結(jié)合,從而有效降低了信息損失,顯著提升了模型的泛化能力。通過精細(xì)的參數(shù)優(yōu)化,模型的重構(gòu)效果也得到了顯著改善。
在多項(xiàng)測(cè)試中,COBRA框架均展現(xiàn)出了卓越的性能。無論是利用公開數(shù)據(jù)集(例如Amazon Product Reviews)還是工業(yè)數(shù)據(jù)集(如百度內(nèi)部數(shù)據(jù)集)進(jìn)行離線和在線評(píng)估,COBRA的表現(xiàn)均超越了當(dāng)前業(yè)界的最高水平。