亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財經(jīng)媒體
科技·商業(yè)·財經(jīng)

Stable Audio Open Small:端側(cè)運行,最快立體聲音頻生成模型亮相

   時間:2025-05-15 10:26 作者:蘇婉清

科技界近日迎來了一項新突破,AI 初創(chuàng)公司 Stability AI 宣布推出 Stable Audio Open Small,這是一款專為智能手機設(shè)計的“立體聲”音頻生成 AI 模型,據(jù)稱在速度上刷新了市場記錄。這一消息由知名科技媒體 TechCrunch 在 5 月 14 日的報道中首次披露。

Stable Audio Open Small 的獨特之處在于其無需依賴云端處理,而是直接在智能手機上流暢運行。Stability AI 強調(diào),該模型能夠在短短 8 秒內(nèi),于手機端生成最長 11 秒的音頻片段,非常適合快速創(chuàng)作鼓點、樂器片段等音效。這一特性使其在便捷性和即時性方面超越了諸如 Suno 和 Udio 等其他 AI 音頻應(yīng)用。

在技術(shù)研發(fā)方面,Stability AI 與芯片制造商 Arm 攜手合作,對模型進行了針對 Arm CPU 的特別優(yōu)化,實現(xiàn)了在智能手機上的離線運行。這一優(yōu)化不僅提升了運行效率,還降低了對網(wǎng)絡(luò)連接的依賴,使得用戶可以在任何環(huán)境下自由創(chuàng)作音頻。

在訓(xùn)練數(shù)據(jù)集的選擇上,Stable Audio Open Small 也展現(xiàn)出了與眾不同的策略。與 Suno 和 Udio 等競爭對手據(jù)稱使用含版權(quán)內(nèi)容的數(shù)據(jù)不同,Stable Audio Open Small 的全部數(shù)據(jù)均來自 Free Music Archive 和 Freesound 免版稅音頻庫。這一做法不僅避免了知識產(chǎn)權(quán)風(fēng)險,還為用戶提供了更加豐富多樣的音頻素材。

然而,Stable Audio Open Small 目前也存在一些限制。例如,它僅支持英文提示,無法生成逼真的歌聲或高質(zhì)量歌曲。由于訓(xùn)練數(shù)據(jù)偏向西方風(fēng)格,該模型在不同音樂類型上的表現(xiàn)也存在差異。盡管如此,Stable Audio Open Small 仍然以其高效、便捷的特點吸引了大量關(guān)注。

在使用條款方面,Stability AI 采取了較為嚴格的規(guī)定。研究人員、愛好者以及年收入低于 100 萬美元的企業(yè)可以免費使用該模型。然而,對于年收入超過這一門檻的開發(fā)者或組織,則需要購買 Stability AI 的企業(yè)許可證。這一規(guī)定旨在平衡商業(yè)利益與技術(shù)創(chuàng)新,確保模型的可持續(xù)發(fā)展。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容