【網(wǎng)界科技】3月8日消息,人工智能語音模型在全球范圍內(nèi)推動跨語言交流
谷歌正在朝著建立一個(gè)支持1000種不同語言的人工智能語言模型的目標(biāo)邁進(jìn)。這項(xiàng)目標(biāo)對于全球范圍內(nèi)的語言交流和信息共享具有重要意義。
谷歌的通用語音模型(USM)是實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵第一步。USM是一個(gè)包含20億個(gè)參數(shù)的語音模型系列,在1200萬小時(shí)的語音和超過300種語言的280億個(gè)句子中進(jìn)行訓(xùn)練。去年11月,谷歌宣布計(jì)劃創(chuàng)建一個(gè)支持全球1000種最常用語言的語言模型,并披露了USM模型。目前,USM已經(jīng)支持超過100種語言,并將作為建立更加廣泛的系統(tǒng)的基礎(chǔ)。
USM已經(jīng)在YouTube上使用,用于生成封閉式字幕和自動語音識別(ASR)。該模型還支持自動檢測和翻譯語言,包括英語、普通話、阿姆哈拉語、宿務(wù)語、阿薩姆語等等。
據(jù)網(wǎng)界科技了解,該技術(shù)的一個(gè)可能應(yīng)用是在增強(qiáng)現(xiàn)實(shí)眼鏡內(nèi)提供實(shí)時(shí)翻譯服務(wù)。這將極大地便利全球范圍內(nèi)的跨語言交流。然而,這項(xiàng)技術(shù)目前仍處于早期階段,還存在一些出錯(cuò)的風(fēng)險(xiǎn)。在去年的I/O活動中,谷歌對阿拉伯語的錯(cuò)誤表述就是一個(gè)例子。
谷歌在語言模型和機(jī)器學(xué)習(xí)領(lǐng)域的努力為我們提供了更多跨越語言和文化障礙的可能性。隨著技術(shù)的不斷進(jìn)步,我們有理由相信,在未來,人工智能語音模型將在全球范圍內(nèi)推動跨語言交流,實(shí)現(xiàn)更加緊密的文化交流和信息共享。