(文章來(lái)源:cnBeta)
外媒報(bào)道稱,為保障 Duo 通話服務(wù)在不穩(wěn)定連接狀態(tài)下的音頻質(zhì)量,谷歌推出了一項(xiàng)名叫 WaveNetEQ 的音質(zhì)改善方案。 據(jù)悉,其基于谷歌 DeepMind 部門的相關(guān)技術(shù),旨在利用人工加入的噪音來(lái)抑制音頻的抖動(dòng)。這種噪音聽起來(lái)就像人類在說(shuō)話,但其實(shí)是通過(guò)機(jī)器學(xué)習(xí)技術(shù)產(chǎn)生的。
如果你曾經(jīng)撥打過(guò)網(wǎng)絡(luò)電話,那肯定多多少少地經(jīng)歷過(guò)因連接不穩(wěn)定而導(dǎo)致的音頻抖動(dòng)。當(dāng)通話期間的部分音頻數(shù)據(jù)包在通信過(guò)程中丟失、延遲過(guò)高、或順序錯(cuò)誤時(shí),就有可能發(fā)生這樣的情況。谷歌表示,99% 的 Duo 通話都會(huì)出現(xiàn)數(shù)據(jù)包丟失,其中 20% 的丟失率超過(guò) 3%、另有 10% 的丟失率超過(guò) 8% 。
每款通信應(yīng)用都有采取某種方式來(lái)處理丟包問(wèn)題,但谷歌表示,傳統(tǒng)的丟包掩飾(PLC)過(guò)程,或?qū)е赂哌_(dá) 60ms 的空缺。
相比之下,基于 DeepMind 神經(jīng)網(wǎng)絡(luò)技術(shù)的 WaveNetEQ 解決方案,已經(jīng)在 48 種不同語(yǔ)言的 100 多個(gè)揚(yáng)聲器數(shù)據(jù)上展開了訓(xùn)練。為增加說(shuō)服力,谷歌還放出了一些 WaveNetEQ 與常見的 PLC 技術(shù)的比較音頻。當(dāng)然,新技術(shù)能夠轉(zhuǎn)換多少音頻,還是有一定的局限的。谷歌表示,WaveNetEQ 旨在替換較短的音頻間隔,而不是真人通話期間漏掉的整個(gè)單次。因此在 120ms 之后,這套系統(tǒng)會(huì)淡出并產(chǎn)生靜音。
通過(guò)評(píng)估,谷歌確保了 WaveNetEQ 不會(huì)引入任何新運(yùn)算的重音,此外所有處理都能夠在用戶的設(shè)備端進(jìn)行,畢竟 Google Duo 默認(rèn)就開啟了端到端加密。一旦網(wǎng)絡(luò)連接變得順暢,真人的音頻會(huì)立即恢復(fù),WaveNetEQ 將無(wú)縫地淡出介入。目前該技術(shù)已在 Pixel 4 智能機(jī)上進(jìn)行測(cè)試,后續(xù)該公司還將向更多設(shè)備推廣。
(責(zé)任編輯:fqj)
-
谷歌
+關(guān)注
關(guān)注
27文章
6257瀏覽量
111949 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
67文章
8562瀏覽量
137208
發(fā)布評(píng)論請(qǐng)先 登錄
谷歌評(píng)論卡,碰一碰即可完成谷歌評(píng)論 #谷歌評(píng)論卡 #NFC標(biāo)簽 #nfc卡
機(jī)器視覺的核心技術(shù)和應(yīng)用場(chǎng)景
【國(guó)慶中秋禮品 Milk-V Duo RISC-V開發(fā)板】開箱、介紹、環(huán)境搭建、工程測(cè)試
【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】開箱和系統(tǒng)體驗(yàn)
【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】基于Duo S 使用 TDL SDK(V2版本)
【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】基于Duo S 使用 TDL SDK(V1版本)
即時(shí)通話軟件音頻傳輸質(zhì)量測(cè)試方案介紹
谷歌將利用機(jī)器學(xué)習(xí)技術(shù)來(lái)改善Duo的通話質(zhì)量
評(píng)論