滾動(dòng)資訊

當(dāng)前位置：網(wǎng)界 > 數(shù)碼極客 > 正文內(nèi)容

英偉達(dá)Parakeet TDT 0.6B：開源ASR新標(biāo)桿，秒速轉(zhuǎn)錄60分鐘音頻

時(shí)間：2025-05-07 14:03 作者：馮璃月

英偉達(dá)近日在語(yǔ)音識(shí)別領(lǐng)域邁出了重要一步，其最新推出的Parakeet TDT 0.6B模型已在Hugging Face平臺(tái)上全面開源，這一消息由科技媒體marktechpost率先報(bào)道。這款先進(jìn)的自動(dòng)語(yǔ)音識(shí)別（ASR）模型，以其卓越的性能和開源的特性，引起了業(yè)界的廣泛關(guān)注。

Parakeet TDT 0.6B的最大亮點(diǎn)在于其驚人的處理速度和高質(zhì)量的轉(zhuǎn)錄效果。據(jù)稱，該模型能夠在短短1秒內(nèi)完成60分鐘音頻的處理，這一速度是當(dāng)前主流開源ASR模型的50倍之多。在Hugging Face的Open ASR Leaderboard上，Parakeet TDT 0.6B的字錯(cuò)率（WER）僅為6.05%，在開源模型中名列前茅，為企業(yè)級(jí)應(yīng)用提供了強(qiáng)有力的支持。

該模型基于Transformer架構(gòu)，并經(jīng)過(guò)高質(zhì)量轉(zhuǎn)錄數(shù)據(jù)的精細(xì)微調(diào)，同時(shí)針對(duì)英偉達(dá)硬件進(jìn)行了優(yōu)化，以進(jìn)一步提升推理效率。其6億參數(shù)的編碼-解碼結(jié)構(gòu)，以及量化和融合內(nèi)核等技術(shù)，都為其出色的性能奠定了堅(jiān)實(shí)基礎(chǔ)。Parakeet TDT 0.6B還支持TDT（Transducer Decoder Transformer）架構(gòu)，并具備精確的時(shí)間戳、數(shù)字格式化和標(biāo)點(diǎn)恢復(fù)等功能，這些特性使其在處理復(fù)雜語(yǔ)音場(chǎng)景時(shí)更加得心應(yīng)手。

Parakeet TDT 0.6B還開創(chuàng)性地支持了歌曲轉(zhuǎn)歌詞轉(zhuǎn)錄功能，這一功能在音樂索引和媒體平臺(tái)等領(lǐng)域具有廣泛的應(yīng)用前景。依托英偉達(dá)的TensorRT和FP8量化技術(shù)，該模型的實(shí)時(shí)率（RTF）高達(dá)3386，進(jìn)一步提升了其在實(shí)際應(yīng)用中的表現(xiàn)。

除了速度和精度外，Parakeet TDT 0.6B還內(nèi)置了多項(xiàng)獨(dú)特功能，以滿足不同領(lǐng)域的需求。例如，它能夠?qū)⒏枨鷥?nèi)容轉(zhuǎn)化為歌詞，適用于音樂和媒體領(lǐng)域；支持?jǐn)?shù)字和時(shí)間戳格式化，提高會(huì)議記錄、法律轉(zhuǎn)錄和醫(yī)療記錄的可讀性；標(biāo)點(diǎn)恢復(fù)功能則能夠增強(qiáng)下游自然語(yǔ)言處理（NLP）應(yīng)用的表現(xiàn)。這些特性不僅大幅提升了轉(zhuǎn)錄質(zhì)量，還減輕了后期處理或人工編輯的負(fù)擔(dān)，特別適合企業(yè)級(jí)部署。

隨著Parakeet TDT 0.6B的開源，更多開發(fā)者將能夠利用這一先進(jìn)的ASR模型，推動(dòng)語(yǔ)音識(shí)別技術(shù)的發(fā)展和應(yīng)用。未來(lái)，我們期待看到更多基于該模型的創(chuàng)新應(yīng)用和技術(shù)突破。

更多>同類內(nèi)容

蘋果iPhone 18 Pro將迎影像大升級(jí)：可變光圈技術(shù)首亮相

05-07

法拉利一季度財(cái)報(bào)亮眼：營(yíng)收漲13%，凈利超4億歐，純電動(dòng)車將亮相

05-07

Ubuntu 25.10 重磅：Rust語(yǔ)言將“入駐”核心組件

05-07

理光GR IV新鏡頭專利曝光，光圈提升半檔曝光量，對(duì)抗富士X-Half？

05-07

TikTok歐洲數(shù)據(jù)安全大動(dòng)作：10億歐建芬蘭數(shù)據(jù)中心

05-07

華為春日服務(wù)大放送，多重福利讓出游無(wú)憂！

05-07

五菱宏光MINIEV四月銷量再奪冠，A00級(jí)新能源市場(chǎng)持續(xù)領(lǐng)跑！

05-07

Fedora Linux 入駐Win11 WSL，用戶可快速安裝體驗(yàn)

05-07

《劍俠情緣?零》公測(cè)倒計(jì)時(shí)！五大門派等你來(lái)戰(zhàn)，5月29日不見不散！

05-07

realme真我GT新概念機(jī)曝光：萬(wàn)毫安電池搭配天璣7300，續(xù)航怪獸來(lái)襲！

05-07

三星One UI Watch 8大揭秘：全新音效、圖標(biāo)更新，Gemini AI閃亮登場(chǎng)？

05-07

TikTok芬蘭設(shè)辦事處，10億歐元建數(shù)據(jù)中心保障1.75億歐洲用戶數(shù)據(jù)安全

05-07

AMD 2025年Q1財(cái)報(bào)亮眼：營(yíng)收大增36%，毛利率達(dá)50%！

05-07

蘋果iOS 17.7.7 RC版更新推送，時(shí)隔239天再迎新進(jìn)展

05-07

新能源車險(xiǎn)續(xù)費(fèi)難，高科技背后的保費(fèi)負(fù)擔(dān)何時(shí)減？

05-06

點(diǎn)擊查看更多 +

全站最新

商湯科技與敦煌美術(shù)館聯(lián)手，AI技術(shù)如何“活化”敦煌文化IP？

魅族Note 16真機(jī)曝光：純白撞色設(shè)計(jì)，中端性價(jià)比新機(jī)來(lái)襲！

胖東來(lái)聯(lián)手京東！12.5億大項(xiàng)目落地河南，年產(chǎn)值預(yù)計(jì)達(dá)25億

蘋果iPhone 18 Pro將迎影像大升級(jí)：可變光圈技術(shù)首亮相

法拉利一季度財(cái)報(bào)亮眼：營(yíng)收漲13%，凈利超4億歐，純電動(dòng)車將亮相

思科量子網(wǎng)絡(luò)芯片原型問世，開啟大規(guī)模量子計(jì)算新時(shí)代？

熱門內(nèi)容

本欄最新

英偉達(dá)Parakeet TDT 0.6B：開源ASR新標(biāo)桿，秒速轉(zhuǎn)錄60分鐘音頻

蘋果iPhone 18 Pro將迎影像大升級(jí)：可變光圈技術(shù)首亮相

法拉利一季度財(cái)報(bào)亮眼：營(yíng)收漲13%，凈利超4億歐，純電動(dòng)車將亮相

Ubuntu 25.10 重磅：Rust語(yǔ)言將“入駐”核心組件

理光GR IV新鏡頭專利曝光，光圈提升半檔曝光量，對(duì)抗富士X-Half？

TikTok歐洲數(shù)據(jù)安全大動(dòng)作：10億歐建芬蘭數(shù)據(jù)中心

網(wǎng)界 - 新財(cái)經(jīng) 新科技新未來(lái) - 網(wǎng)界傳媒旗下網(wǎng)站 - 中國(guó) · 北京
合作咨詢微信：netspread（注明:網(wǎng)界）
網(wǎng)界^?是本公司38類注冊(cè)商標(biāo)，是該商標(biāo)的唯一持有者，未經(jīng)授本公司授權(quán)，嚴(yán)禁使用。
Copyright ? CNU 2012-2022 www.mladies.com.cn All rights reserved. 魯ICP備2022032383號(hào)-6

亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

英偉達(dá)Parakeet TDT 0.6B：開源ASR新標(biāo)桿，秒速轉(zhuǎn)錄60分鐘音頻