chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出端到端語(yǔ)音翻譯技術(shù),讓優(yōu)質(zhì)高效的機(jī)器翻譯不再遙遙無(wú)期

電子工程師 ? 來(lái)源:YXQ ? 2019-05-17 16:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

40年前,英國(guó)科幻作家Douglas Adams在他的《銀河系漫游指南》中這樣描述巴別魚(yú)(bable fish):迷你黃色生物,水蛭狀,以聲音中的語(yǔ)言概念為食,消化后排出跟寄主同頻的腦波。只要塞到耳朵里去,就可以聽(tīng)懂各種語(yǔ)言。

而在這個(gè)充滿嬉皮風(fēng)格的科幻作品中,來(lái)自地球的Arthur Dent也因?yàn)檫@條丑陋的魚(yú),能夠完美地理解并與他遇到的各種外星種族交流。

自小說(shuō)誕生,巴別魚(yú)便成為了即時(shí)語(yǔ)音翻譯的代名詞。但在當(dāng)時(shí),人類的翻譯技術(shù)距離這一目標(biāo)仍遙不可及。

直到2014年,加拿大蒙特利爾大學(xué)的Kyunghyun Cho、Yoshua Bengio等人發(fā)布了一篇在機(jī)器翻譯領(lǐng)域應(yīng)用神經(jīng)網(wǎng)絡(luò)的論文——Neural Machine Translation by Jointly Learning to Align and Translate。

神經(jīng)網(wǎng)絡(luò)的出現(xiàn),讓優(yōu)質(zhì)高效的機(jī)器翻譯不再遙遙無(wú)期。

每次技術(shù)的突破都讓我們離巴別魚(yú)更近一步,直到今天,谷歌的發(fā)布了一項(xiàng)新研究Translatotron,這是一種可以實(shí)現(xiàn)端到端的語(yǔ)音轉(zhuǎn)語(yǔ)音的翻譯技術(shù)。該工具放棄了將語(yǔ)音翻譯成文本在返回語(yǔ)音的步驟,可以直接從一種語(yǔ)言轉(zhuǎn)換稱另外一種語(yǔ)言,并同時(shí)保持說(shuō)話著的語(yǔ)調(diào)和節(jié)奏。

告別Siri,我們先來(lái)感受一下翻譯的調(diào)調(diào):

通過(guò)結(jié)合揚(yáng)聲器編碼器網(wǎng)絡(luò),使得Translatotron能夠在翻譯的語(yǔ)音中保留原始揚(yáng)聲器的聲音特征,這使得翻譯的語(yǔ)音聽(tīng)起來(lái)更自然,更少刺耳。

更多聲音樣本可以在Translatotron的Google Research的Github頁(yè)面上找到。

此功能利用了谷歌之前specker verification 和 speaker adaptation for TTS 的研究。揚(yáng)聲器編碼器在specker verification任務(wù)上預(yù)先訓(xùn)練,學(xué)習(xí)從簡(jiǎn)短的示例話語(yǔ)對(duì)揚(yáng)聲器特性進(jìn)行編碼。即使內(nèi)容是不同的語(yǔ)言,該編碼上調(diào)節(jié)頻譜圖解碼器也可使得合成具有類似揚(yáng)聲器特性的語(yǔ)音。

Translatotron模型

其實(shí)語(yǔ)音翻譯的端到端模型的早在2016年就開(kāi)始出現(xiàn)了,當(dāng)時(shí)研究人員證明了使用單個(gè)序列到序列模型進(jìn)行語(yǔ)音到文本翻譯的可行性。

2017年,谷歌研究員們證明了這種端到端模型可以勝過(guò)cascade模型。之后又進(jìn)一步改進(jìn)許多端到端語(yǔ)音到文本翻譯模型的方法。

最終在2019年,谷歌的研究員們?cè)赼rXiv發(fā)表Translatotron模型,通過(guò)證明單個(gè)序列到序列模型可以直接將語(yǔ)言從一種語(yǔ)言翻譯成另一種語(yǔ)言的語(yǔ)音,而不依賴于任何一種語(yǔ)言的中間文本表示。

Translatotron基于序列到序列網(wǎng)絡(luò)將源光譜圖作為輸入并生成目標(biāo)語(yǔ)言中的翻譯內(nèi)容的光譜圖輸出。它還使用了另外兩個(gè)經(jīng)過(guò)單獨(dú)訓(xùn)練的組件:神經(jīng)聲碼器將輸出頻譜圖轉(zhuǎn)換為時(shí)域波形,使用揚(yáng)聲器編碼器來(lái)保持合成的翻譯語(yǔ)音中源說(shuō)話者的語(yǔ)音的特征。

在訓(xùn)練期間,序列到序列模型使用多任務(wù)目標(biāo)來(lái)在生成目標(biāo)譜圖的同時(shí)預(yù)測(cè)源和目標(biāo)轉(zhuǎn)錄物。

Translatotron的模型結(jié)構(gòu)

該團(tuán)隊(duì)稱,翻譯的準(zhǔn)確性并不如傳統(tǒng)翻譯系統(tǒng)那么好,傳統(tǒng)系統(tǒng)有更多時(shí)間來(lái)磨練其準(zhǔn)確性。但Translatotron是第一個(gè)能夠?qū)⒄Z(yǔ)言從一種語(yǔ)言直接翻譯成另一種語(yǔ)言的語(yǔ)音的端到端模型。他們希望這項(xiàng)工作可以作為未來(lái)端到端語(yǔ)音轉(zhuǎn)語(yǔ)音翻譯系統(tǒng)研究的起點(diǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6252

    瀏覽量

    111234
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1811

    瀏覽量

    115985

原文標(biāo)題:巴別魚(yú)雛形,谷歌推出端到端語(yǔ)音翻譯技術(shù),還能模仿你說(shuō)話

文章出處:【微信號(hào):BigDataDigest,微信公眾號(hào):大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    谷歌推出TranslateGemma全新開(kāi)放翻譯模型系列

    我們已正式推出 TranslateGemma,這一全新的開(kāi)放翻譯模型系列基于 Gemma 3 構(gòu)建,并提供 4B、12B 和 27B 三種參數(shù)規(guī)模。TranslateGemma 的問(wèn)世標(biāo)志著開(kāi)放翻譯領(lǐng)域邁出了重要一步,它可幫助人
    的頭像 發(fā)表于 02-26 10:22 ?218次閱讀

    晶晨攜手谷歌,助力側(cè)大模型Gemini的硬件落地

    電子發(fā)燒友網(wǎng)報(bào)道 在科技飛速發(fā)展的當(dāng)下,側(cè)智能技術(shù)正以前所未有的速度滲透各個(gè)領(lǐng)域。1月28日,晶晨股份透露,公司與谷歌有著長(zhǎng)達(dá)十余年的深度合作基礎(chǔ)。作為
    的頭像 發(fā)表于 01-29 10:44 ?1225次閱讀

    側(cè)大模型上車:從“語(yǔ)音助手”“車內(nèi) AI 智能體”的躍遷革命

    2025年,智能汽車的座艙不再只是“語(yǔ)音助手”的舞臺(tái),而是一個(gè)搭載生成式AI和大語(yǔ)言模型(LLM)的智能體。從云端示范車內(nèi)落地,這一跨越不僅改變了人機(jī)交互的邊界,更重構(gòu)了汽車作為“第三
    的頭像 發(fā)表于 01-13 09:10 ?454次閱讀

    視美泰發(fā)布AI即時(shí)翻譯機(jī)解決方案,硬核配置+多語(yǔ)種覆蓋破解跨語(yǔ)言溝通難題

    、機(jī)器翻譯語(yǔ)音合成和大模型四項(xiàng)能力構(gòu)建高效同聲傳譯鏈路,實(shí)現(xiàn)70+種語(yǔ)言全覆蓋的強(qiáng)大能力,為跨境商貿(mào)、文化交流、戶外出行等場(chǎng)景提供高效精準(zhǔn)的翻譯
    的頭像 發(fā)表于 12-03 10:50 ?1055次閱讀
    視美泰發(fā)布AI即時(shí)<b class='flag-5'>翻譯</b>機(jī)解決方案,硬核配置+多語(yǔ)種覆蓋破解跨語(yǔ)言溝通難題

    國(guó)慶出國(guó)游,時(shí)空壺新T1翻譯機(jī),首個(gè)側(cè)模型突破助力跨語(yǔ)言交流

    的旗艦機(jī)型,最大亮點(diǎn)是搭載業(yè)內(nèi)首個(gè)側(cè)AI翻譯模型。這一模型將原本依賴云端算力的復(fù)雜AI翻譯模型,通過(guò)先進(jìn)的模型剪枝、量化壓縮等技術(shù),巧妙部署于設(shè)備本地,并對(duì)神經(jīng)網(wǎng)
    的頭像 發(fā)表于 09-12 12:20 ?1002次閱讀
    國(guó)慶出國(guó)游,時(shí)空壺新T1<b class='flag-5'>翻譯</b>機(jī),首個(gè)<b class='flag-5'>端</b>側(cè)模型突破助力跨語(yǔ)言交流

    語(yǔ)音交互數(shù)據(jù) 精準(zhǔn)賦能語(yǔ)音大模型進(jìn)階

    模型在多輪對(duì)話、噪聲環(huán)境及語(yǔ)義理解方面表現(xiàn)不佳。 相較于傳統(tǒng)數(shù)據(jù)集僅關(guān)注語(yǔ)音-文本的單點(diǎn)轉(zhuǎn)寫(xiě),語(yǔ)音交互數(shù)據(jù)集強(qiáng)調(diào)在真實(shí)多輪對(duì)話場(chǎng)景下的
    的頭像 發(fā)表于 09-11 17:17 ?722次閱讀

    黑芝麻智能全棧式輔助駕駛系統(tǒng)的應(yīng)用場(chǎng)景

    黑芝麻智能推出的全新一代全棧輔助駕駛系統(tǒng),以武當(dāng)C1200系列高算力芯片為基石,深度融合自研感知算法,實(shí)現(xiàn)從場(chǎng)景感知車輛控制的完全閉
    的頭像 發(fā)表于 09-09 17:19 ?2557次閱讀

    當(dāng)翻譯失去網(wǎng)絡(luò),時(shí)空壺新T1翻譯機(jī)開(kāi)創(chuàng)首個(gè)離線模型賦能全球溝通新體驗(yàn)

    全球首創(chuàng)的離線側(cè)AI翻譯模型,這一技術(shù)突破堪稱行業(yè)變革性創(chuàng)舉。與傳統(tǒng)依賴網(wǎng)絡(luò)或僅靠靜態(tài)離線語(yǔ)言包的翻譯設(shè)備不同,T1的離線模型基于先進(jìn)的
    的頭像 發(fā)表于 09-08 16:52 ?1190次閱讀
    當(dāng)<b class='flag-5'>翻譯</b>失去網(wǎng)絡(luò),時(shí)空壺新T1<b class='flag-5'>翻譯</b>機(jī)開(kāi)創(chuàng)首個(gè)離線模型賦能全球溝通新體驗(yàn)

    當(dāng)經(jīng)典IP撞上AI技術(shù):利爾達(dá)助力躍然創(chuàng)新推出全球首款AI互動(dòng)玩具

    //當(dāng)孩子們手中的奧特曼玩具不僅能發(fā)光發(fā)聲,還能真正智能對(duì)話、情感陪伴,傳統(tǒng)的玩具行業(yè)正經(jīng)歷一場(chǎng)前所未有的技術(shù)革命……今日,AI玩具領(lǐng)軍企業(yè)躍然創(chuàng)新(Haivivi)推出全球首款搭載
    的頭像 發(fā)表于 08-26 17:37 ?1948次閱讀
    當(dāng)經(jīng)典IP撞上AI<b class='flag-5'>技術(shù)</b>:利爾達(dá)助力躍然創(chuàng)新<b class='flag-5'>推出</b>全球首款<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>AI互動(dòng)玩具

    聲智科技出席2025年北京市多語(yǔ)種AI語(yǔ)音翻譯大賽

    8月20日,由北京市科委、中關(guān)村管委會(huì)主辦,北京語(yǔ)言大學(xué)、北京第二外國(guó)語(yǔ)學(xué)院、北京市翻譯協(xié)會(huì)、中國(guó)人工智能百人會(huì)共同承辦的“2025年北京市多語(yǔ)種AI語(yǔ)音翻譯大賽”在中關(guān)村展示中心順利啟幕。聲智作為
    的頭像 發(fā)表于 08-25 17:18 ?1221次閱讀

    傳音斬獲WMT 2025國(guó)際機(jī)器翻譯大賽四項(xiàng)冠軍

    近日,在由國(guó)際計(jì)算語(yǔ)言學(xué)協(xié)會(huì)(ACL)主辦的WMT 2025國(guó)際機(jī)器翻譯大賽中,傳音在低資源印度語(yǔ)言翻譯任務(wù)(Low-Resource Indic Language Translation)中斬獲
    的頭像 發(fā)表于 08-06 18:21 ?1211次閱讀

    廣和通發(fā)布自研側(cè)語(yǔ)音識(shí)別大模型FiboASR

    、高效會(huì)議記錄、多語(yǔ)種即時(shí)翻譯等核心領(lǐng)域?qū)崿F(xiàn)重大技術(shù)突破,致力于為終端用戶帶來(lái)更自然、高效、私密的語(yǔ)音交互體驗(yàn)。
    的頭像 發(fā)表于 08-04 11:43 ?1571次閱讀

    水表界的“翻譯官”:CCLinkIE和Modbus TCP“無(wú)障礙聊天”!

    ,耐達(dá)訊通信技術(shù)CCLinkIE轉(zhuǎn)Modbus TCP網(wǎng)關(guān)堪稱“設(shè)備和諧大使”。它無(wú)需替換舊設(shè)備,就能讓新老系統(tǒng)高效協(xié)作,為工程師省下大筆改造費(fèi)用,還帶來(lái)靈活的系統(tǒng)升級(jí)方案。當(dāng)你的車間出現(xiàn)“協(xié)議吵架”時(shí),不妨請(qǐng)這位“翻譯官”來(lái)場(chǎng)
    發(fā)表于 07-10 15:43

    時(shí)空壺 T1 離線翻譯機(jī):解鎖無(wú)網(wǎng)生活溝通自由

    頻頻“掉鏈子”。時(shí)空壺T1離線翻譯機(jī),憑借強(qiáng)大的側(cè)AI模型與離線翻譯能力,為人們?cè)诙嘣顖?chǎng)景中打破語(yǔ)言壁壘,帶來(lái)高效、穩(wěn)定且流暢的溝通體驗(yàn)。一、全場(chǎng)景適配,出
    的頭像 發(fā)表于 06-05 10:30 ?905次閱讀
    時(shí)空壺 T1 離線<b class='flag-5'>翻譯</b>機(jī):解鎖無(wú)網(wǎng)生活溝通自由

    小米汽車智駕技術(shù)介紹

    后起之秀,小米在宣布造車前被非常多的人質(zhì)疑,但在“真香”定律下,小米創(chuàng)下了很多友商所不能及的成就。作為科技企業(yè),小米也在智能駕駛領(lǐng)域也不斷研發(fā)及突破,并推送了自動(dòng)駕駛系統(tǒng)。 小米
    的頭像 發(fā)表于 03-31 18:17 ?5187次閱讀
    小米汽車<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>智駕<b class='flag-5'>技術(shù)</b>介紹