Stability AI 正式推出企業(yè)級(jí)音頻生成模型 Stable Audio 2.5,顯著提升音頻細(xì)節(jié)與生成效率。新模型優(yōu)化音樂(lè)結(jié)構(gòu)完整性,可自然呈現(xiàn)前奏、發(fā)展與結(jié)尾等多段式編排,并增強(qiáng)對(duì)提示詞的理解能力,尤其在情緒和風(fēng)格響應(yīng)上更貼合用戶預(yù)期。
通過(guò)后訓(xùn)練技術(shù) ARC,模型大幅壓縮 GPU 推理時(shí)間,實(shí)現(xiàn)高速高質(zhì)量音頻生成。新增音頻修補(bǔ)功能,支持用戶導(dǎo)入自有音頻并進(jìn)行智能延長(zhǎng),適用于剪輯等場(chǎng)景。目前該模型已在官網(wǎng)開(kāi)放試用,支持本地部署,并內(nèi)置版權(quán)檢測(cè)機(jī)制以保障合規(guī)使用。
免責(zé)聲明:本文內(nèi)容由開(kāi)放的智能模型自動(dòng)生成,僅供參考。