chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

科大訊飛語(yǔ)音翻譯新技術(shù)路線上再獲突破

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-11-05 17:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

科大訊飛日前在全球最具影響力的口語(yǔ)機(jī)器翻譯評(píng)測(cè)比賽IWSLT中,獲得了語(yǔ)音翻譯端到端模型評(píng)測(cè)的冠軍,還成為英德口語(yǔ)翻譯任務(wù)中唯一受邀做Oral report的參賽團(tuán)隊(duì)。端到端技術(shù)是當(dāng)前語(yǔ)音翻譯的研究前沿,科大訊飛聯(lián)合優(yōu)化語(yǔ)音識(shí)別和機(jī)器翻譯的新技術(shù)路線,理論上更具前景,一旦技術(shù)研究成功,將為翻譯機(jī)器性能的提升帶來(lái)極大促進(jìn)。

提問(wèn):語(yǔ)音翻譯涉及哪些步驟?

你或許會(huì)說(shuō),語(yǔ)音識(shí)別和機(jī)器翻譯——沒(méi)錯(cuò),傳統(tǒng)的語(yǔ)音翻譯通常采用語(yǔ)音識(shí)別和機(jī)器翻譯級(jí)聯(lián)的方式實(shí)現(xiàn),對(duì)輸入語(yǔ)音先進(jìn)行語(yǔ)音識(shí)別得到文本結(jié)果,然后再基于文本進(jìn)行機(jī)器翻譯,這也是當(dāng)前語(yǔ)音翻譯采用的主流方法。

不過(guò),由于口語(yǔ)句子中含有大量非規(guī)范語(yǔ)言現(xiàn)象,例如重復(fù)、省略、顛倒,以及語(yǔ)義邏輯不清,斷句困難等問(wèn)題,導(dǎo)致后續(xù)機(jī)器翻譯帶來(lái)嚴(yán)重的挑戰(zhàn)。此外,復(fù)雜環(huán)境下語(yǔ)音識(shí)別受發(fā)音人口音、環(huán)境噪聲,以及和語(yǔ)言中存在的同音詞、易混淆詞等復(fù)雜音素的影響也存在著識(shí)別錯(cuò)誤,對(duì)最終機(jī)器翻譯性能也可能帶來(lái)影響。

因此,實(shí)際應(yīng)用系統(tǒng)中,通常會(huì)在語(yǔ)音識(shí)別和機(jī)器翻譯之間增加一個(gè)語(yǔ)音識(shí)別后處理模塊,通過(guò)對(duì)識(shí)別結(jié)果進(jìn)行規(guī)整、斷句、順滑、標(biāo)點(diǎn)預(yù)測(cè),甚至糾錯(cuò)來(lái)盡可能地減小口語(yǔ)化和識(shí)別錯(cuò)誤的影響。

不過(guò),受語(yǔ)音和語(yǔ)言復(fù)雜性的影響,截止到目前為止,這些問(wèn)題并沒(méi)有被真正解決。

在剛剛結(jié)束的2018年國(guó)際口語(yǔ)機(jī)器翻譯評(píng)測(cè)比賽(International Workshop on Spoken Language Translation,IWSLT)中,科大訊飛團(tuán)隊(duì)在端到端模型(End-to-End Model)的評(píng)測(cè)比賽中,以顯著優(yōu)勢(shì)奪得第一名。該獎(jiǎng)項(xiàng)也是科大訊飛今年在各項(xiàng)國(guó)際競(jìng)賽中的第9個(gè)“世界冠軍”。

端到端語(yǔ)音翻譯技術(shù)路線,是通過(guò)構(gòu)造一個(gè)完整的神經(jīng)網(wǎng)絡(luò)模型,聯(lián)合優(yōu)化語(yǔ)音識(shí)別、識(shí)別后處理和機(jī)器翻譯,建立源語(yǔ)言語(yǔ)音信號(hào)到目標(biāo)語(yǔ)言文字的映射關(guān)系,進(jìn)而實(shí)現(xiàn)從原始語(yǔ)音到目標(biāo)譯文的翻譯。

這提供了一種解決語(yǔ)音翻譯的新思路,而且從目前看是初步可行的。一旦技術(shù)研究成功,理論上可以讓語(yǔ)音翻譯更準(zhǔn)更快,未來(lái)也將為翻譯機(jī)器性能的提升帶來(lái)極大促進(jìn)。

國(guó)際頂級(jí)口語(yǔ)機(jī)器翻譯評(píng)測(cè)比賽 IWSLT,推動(dòng)語(yǔ)音翻譯新方向

IWSLT是國(guó)際上最具影響力的口語(yǔ)機(jī)器翻譯評(píng)測(cè)比賽之一,重點(diǎn)關(guān)注口語(yǔ),實(shí)現(xiàn)語(yǔ)音到文本的翻譯,從而解決人和人交流的問(wèn)題。

到目前為止,IWSLT已經(jīng)舉辦了15屆,吸引了全球70多家科研團(tuán)隊(duì)的參與。IWSLT針對(duì)語(yǔ)音翻譯實(shí)際應(yīng)用面臨的難題,通過(guò)每年設(shè)定一些研究任務(wù),并向外界提供公開的數(shù)據(jù)集合和評(píng)測(cè)交流機(jī)會(huì),吸引了來(lái)自全球的科研團(tuán)隊(duì)參與,對(duì)于推動(dòng)語(yǔ)音翻譯技術(shù)創(chuàng)新和知識(shí)共享具有重要的意義。

除了科大訊飛,IWSLT 2018吸引了世界各地多所機(jī)器翻譯領(lǐng)域的知名大學(xué)及研究所參加,包括英國(guó)愛(ài)丁堡大學(xué)(University of Edinburgh)、美國(guó)約翰霍普金斯大學(xué)(JHU)、德國(guó)卡爾斯魯厄理工學(xué)院(KIT)、意大利Bruno Kessler 基金會(huì)(FBK)、芬蘭赫爾辛基大學(xué)(Helsinki),以及國(guó)內(nèi)的阿里巴巴、搜狗等。

本次比賽包括兩個(gè)主要任務(wù),一是英語(yǔ)到德語(yǔ)演講場(chǎng)景下的語(yǔ)音翻譯任務(wù);二是巴斯克語(yǔ)到英語(yǔ)的低資源文本翻譯任務(wù)。

其中,在英語(yǔ)到德語(yǔ)的語(yǔ)音翻譯任務(wù)上,主辦方在今年提出了兩種評(píng)測(cè)方案:

傳統(tǒng)路線,也即語(yǔ)音識(shí)別、識(shí)別后處理、機(jī)器翻譯分而治之,稱之為基線模型(baseline Model);

端到端模型(End-to-end Model),將語(yǔ)音識(shí)別、識(shí)別后處理和機(jī)器翻譯統(tǒng)一起來(lái)聯(lián)合優(yōu)化,能夠在一定程度上避免傳統(tǒng)基線模型中存在的識(shí)別錯(cuò)誤擴(kuò)散等問(wèn)題,是一種新的思路,理論上更具前景。

端到端模型是當(dāng)前口語(yǔ)翻譯研究領(lǐng)域的前沿,隨著深度學(xué)習(xí)的進(jìn)步,研究人員開始探索通過(guò)構(gòu)造一個(gè)完整的神經(jīng)網(wǎng)絡(luò)模型,建立語(yǔ)音信號(hào)到目標(biāo)文字的映射關(guān)系。

該方法通過(guò)將語(yǔ)音識(shí)別、識(shí)別后處理和機(jī)器翻譯統(tǒng)一起來(lái)聯(lián)合優(yōu)化,為解決傳統(tǒng)級(jí)聯(lián)方案分而治之中存在的難題提供了一種新的思路。例如,2017年Interspeech會(huì)議上,谷歌研究人員就將該方法應(yīng)用到西班牙到英語(yǔ)的語(yǔ)音翻譯任務(wù)上,取得初步成效。

引入這一新的評(píng)測(cè)方案,也體現(xiàn)了IWSLT主辦方引導(dǎo)科研探索,推動(dòng)語(yǔ)音翻譯技術(shù)不斷進(jìn)步的努力。

科大訊飛勇于挑戰(zhàn)新路線,端到端語(yǔ)音翻譯獲得第一

科大訊飛參與了口語(yǔ)翻譯的兩種評(píng)測(cè),并且是唯一參與端到端模型這種新技術(shù)路線的中國(guó)團(tuán)隊(duì)。不僅如此,科大訊飛還作為唯一受組委會(huì)邀請(qǐng)的語(yǔ)音翻譯任務(wù)參賽團(tuán)隊(duì)、進(jìn)行Oral report,向與會(huì)人員分享兩種技術(shù)路線研究所采用的方法,對(duì)促進(jìn)語(yǔ)音翻譯新技術(shù)的進(jìn)步具有重要作用。

因?yàn)檎Z(yǔ)言和語(yǔ)音本身的復(fù)雜性,新技術(shù)路線對(duì)統(tǒng)一建模需要很強(qiáng)的語(yǔ)音處理能力和調(diào)序能力,加之語(yǔ)言本身受到口語(yǔ)表達(dá)、環(huán)境噪聲的干擾,所以端到端技術(shù)路線要實(shí)現(xiàn)從原始語(yǔ)音到目標(biāo)文本的翻譯,就是難上加難。

值得一提,賽事提供的公開數(shù)據(jù)集合中,能夠?yàn)槎说蕉四P头椒ㄌ峁┲苯拥挠斜O(jiān)督數(shù)據(jù)是小規(guī)模的。要在3個(gè)月的時(shí)間里,在小規(guī)模數(shù)據(jù)上構(gòu)建一套高性能的端到端語(yǔ)音翻譯系統(tǒng),非常具有挑戰(zhàn)性。

基于語(yǔ)音和機(jī)器翻譯上雄厚的技術(shù)積累,訊飛研究團(tuán)隊(duì)針對(duì)端到端語(yǔ)音翻譯任務(wù)開展了探索性研究,最終在英德語(yǔ)音翻譯任務(wù)的端到端模型評(píng)測(cè)方案上獲得了第一名(與第二名BLEU分?jǐn)?shù)拉開9個(gè)百分點(diǎn),一般而言,提升3個(gè)百分點(diǎn)就能明顯體會(huì)到系統(tǒng)的優(yōu)劣差異)。

不僅如此,在基線模型評(píng)測(cè)中,科大訊飛也取得了第二名的好成績(jī)。

“比賽的成績(jī)只是一方面,我們看重的是在源頭技術(shù)、新技術(shù)上進(jìn)行探索,”科大訊飛的研究人員表示。

“我們參加了本次IWSLT評(píng)測(cè)的語(yǔ)音翻譯任務(wù),在基于傳統(tǒng)的基線模型中,針對(duì)語(yǔ)音識(shí)別文本結(jié)果和機(jī)器翻譯訓(xùn)練數(shù)據(jù)源語(yǔ)言文本風(fēng)格不匹配問(wèn)題,提出了對(duì)源語(yǔ)言文本逆變換以適配識(shí)別風(fēng)格的方法,提高了語(yǔ)音翻譯的魯棒性。在端到端模型中,提出了基于DenseNet和BiLSTM編碼,以及基于自注意力機(jī)制解碼的端到端建模方案。實(shí)驗(yàn)結(jié)果表明,盡管當(dāng)前端到端模型的效果低于傳統(tǒng)方法,但從結(jié)果來(lái)看也證明該方法具有一定的可行性,整體系統(tǒng)框架也更加簡(jiǎn)潔優(yōu)雅,有望為語(yǔ)音翻譯提供一種新的解決思路?!?/p>

客觀評(píng)價(jià)語(yǔ)音翻譯端到端技術(shù),數(shù)據(jù)將是一大瓶頸和障礙,因?yàn)檎Z(yǔ)音識(shí)別的數(shù)據(jù)已積累了上十萬(wàn)小時(shí)、機(jī)器翻譯的數(shù)據(jù)搜集也達(dá)到千萬(wàn)甚至上億,但端到端的模型,需要專門的語(yǔ)音到文本的句對(duì),這方面的數(shù)據(jù)目前積累不夠,若要商業(yè)化,還需要更大的數(shù)據(jù)支撐。

對(duì)此,科大訊飛研究團(tuán)隊(duì)表示,“由于語(yǔ)音翻譯任務(wù)的復(fù)雜性以及訓(xùn)練數(shù)據(jù)搜集的困難,無(wú)論傳統(tǒng)的基線模型方案還是最新提出的端到端語(yǔ)音翻譯方案,在實(shí)際應(yīng)用中都還面臨一系列的難題,需要學(xué)術(shù)界和產(chǎn)業(yè)界共同努力?!?/p>

至于端到端的新技術(shù),“如果能減少對(duì)有監(jiān)督語(yǔ)音翻譯平行數(shù)據(jù)的依賴那是最好不過(guò),而且這存在一定的可能性,例如可以嘗試借用現(xiàn)有的語(yǔ)音識(shí)別訓(xùn)練數(shù)據(jù)和機(jī)器翻譯訓(xùn)練數(shù)據(jù),我們正在努力探索?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1811

    瀏覽量

    115985
  • 機(jī)器翻譯
    +關(guān)注

    關(guān)注

    0

    文章

    141

    瀏覽量

    15520
  • 科大訊飛
    +關(guān)注

    關(guān)注

    19

    文章

    859

    瀏覽量

    63656

原文標(biāo)題:語(yǔ)音翻譯也能端到端?深度學(xué)習(xí)這條路有戲!

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    科大飛設(shè)立子公司:加碼AI與集成電路業(yè)務(wù)布局

    ,經(jīng)營(yíng)范圍涵蓋人工智能公共服務(wù)平臺(tái)技術(shù)咨詢服務(wù)、集成電路設(shè)計(jì)、人工智能基礎(chǔ)軟件開發(fā)等業(yè)務(wù),由科大飛全資持股。此次新設(shè)子公司是科大飛持續(xù)加
    發(fā)表于 12-29 08:53 ?958次閱讀

    科大飛蒞臨一汽奔騰座談交流

    11月8日,科大飛股份有限公司總裁吳曉如一行來(lái)訪一汽奔騰。一汽奔騰企業(yè)負(fù)責(zé)人等相關(guān)人員接待來(lái)賓,并進(jìn)行座談交流。
    的頭像 發(fā)表于 11-11 17:21 ?1270次閱讀

    2025科大飛全球1024開發(fā)者節(jié)精彩回顧

    當(dāng)全球產(chǎn)業(yè)格局和競(jìng)爭(zhēng)形態(tài)重塑之時(shí),AI將如何發(fā)展?11月6日,在第八屆世界聲博會(huì)暨2025科大飛全球1024開發(fā)者節(jié)發(fā)布會(huì)上,科大飛董事長(zhǎng)劉慶峰以《更懂你的AI》為主題,給出了清晰
    的頭像 發(fā)表于 11-10 11:51 ?856次閱讀
    2025<b class='flag-5'>科大</b><b class='flag-5'>訊</b>飛全球1024開發(fā)者節(jié)精彩回顧

    科大飛發(fā)布飛星火X1.5及系列AI產(chǎn)品

    11月6日,第八屆世界聲博會(huì)暨2025科大飛全球1024開發(fā)者節(jié)發(fā)布會(huì)上,科大飛以《更懂你的AI》為主題發(fā)布飛星火大模型最
    的頭像 發(fā)表于 11-10 11:49 ?903次閱讀

    科大飛上半年虧損2.39億元,AI學(xué)習(xí)機(jī)、翻譯機(jī)、錄音筆銷量可觀

    研發(fā)投入23.92億元,占營(yíng)業(yè)收入的比例達(dá)21.92%。 ? 與此同時(shí),面向消費(fèi)者的業(yè)務(wù)(TOC業(yè)務(wù))繼續(xù)保持快速增長(zhǎng),其中科大飛AI學(xué)習(xí)機(jī)表現(xiàn)尤為突出,上半年收入實(shí)現(xiàn)翻番增長(zhǎng)。 科大
    的頭像 發(fā)表于 08-24 07:45 ?6992次閱讀
    <b class='flag-5'>科大</b><b class='flag-5'>訊</b>飛上半年虧損2.39億元,AI學(xué)習(xí)機(jī)、<b class='flag-5'>翻譯</b>機(jī)、錄音筆銷量可觀

    科大飛上半年虧損2.39億元,AI學(xué)習(xí)機(jī)、翻譯機(jī)、錄音筆銷量可觀

    上半年研發(fā)投入23.92億元,占營(yíng)業(yè)收入的比例達(dá)21.92%。 與此同時(shí),面向消費(fèi)者的業(yè)務(wù)(TOC業(yè)務(wù))繼續(xù)保持快速增長(zhǎng),其中科大飛AI學(xué)習(xí)機(jī)表現(xiàn)尤為突出,上半年收入實(shí)現(xiàn)翻番增長(zhǎng)。 科大
    發(fā)表于 08-24 01:12 ?1826次閱讀

    打破交互困局:科大飛這樣出手

    十年深耕,科大飛智能交互如何引領(lǐng)未來(lái)
    的頭像 發(fā)表于 06-17 11:50 ?1147次閱讀
    打破交互困局:<b class='flag-5'>科大</b><b class='flag-5'>訊</b>飛這樣出手

    回顧科大飛26周年慶精彩瞬間

    近日,科大飛26周年司慶上,董事長(zhǎng)劉慶峰對(duì)這個(gè)作文題感觸很深:“從1999年創(chuàng)業(yè)時(shí)在“中國(guó)被人扼住了咽喉”背景下以語(yǔ)音合成系統(tǒng)破局,到這些年智能語(yǔ)音、機(jī)器
    的頭像 發(fā)表于 06-13 14:08 ?964次閱讀

    科大飛加速東南亞企業(yè)的人工智能應(yīng)用

    日前,科大飛在新加坡成功舉辦合作伙伴峰會(huì)暨創(chuàng)新產(chǎn)品發(fā)布會(huì)。這場(chǎng)匯聚關(guān)鍵合作伙伴、行業(yè)先驅(qū)和技術(shù)領(lǐng)袖的盛會(huì),不僅集中展示了科大飛最新AI創(chuàng)
    的頭像 發(fā)表于 05-06 09:39 ?895次閱讀

    科大飛亮相第137屆廣交會(huì)

    今天,第137屆中國(guó)進(jìn)出口商品交易會(huì)(廣交會(huì))在廣州開幕。科大飛又一年參展,集中展示了飛星火大模型的最新技術(shù)成果以及在辦公、教育、汽車、工業(yè)等領(lǐng)域的產(chǎn)品和應(yīng)用。
    的頭像 發(fā)表于 04-17 09:30 ?1117次閱讀

    科大飛深度解析DeepSeek-V3/R1推理系統(tǒng)成本

    本篇分析來(lái)自科大技術(shù)團(tuán)隊(duì),深度解析了DeepSeek-V3 / R1 推理系統(tǒng)成本,旨在助力開發(fā)者實(shí)現(xiàn)高性價(jià)比的MoE集群部署方案。感謝飛研究院副院長(zhǎng)&AI工程院常務(wù)副院長(zhǎng)龍明康
    的頭像 發(fā)表于 04-15 13:46 ?3983次閱讀
    <b class='flag-5'>科大</b><b class='flag-5'>訊</b>飛深度解析DeepSeek-V3/R1推理系統(tǒng)成本

    科大飛與英泰斯特簽署戰(zhàn)略合作協(xié)議

    近日,科大飛股份有限公司與武漢英泰斯特電子技術(shù)有限公司正式簽署戰(zhàn)略合作協(xié)議,雙方將聚焦智能網(wǎng)聯(lián)汽車 “車路云一體化” 領(lǐng)域,圍繞技術(shù)研發(fā)、場(chǎng)景落地、生態(tài)構(gòu)建等方向展開深度合作,共同推
    的頭像 發(fā)表于 03-26 13:56 ?1142次閱讀

    科大飛攜手西安鐵路局打造人工智能平臺(tái)

    近日,科大飛攜手中國(guó)鐵路西安局集團(tuán)有限公司(以下簡(jiǎn)稱“西安鐵路局”)打造的人工智能平臺(tái)正式上線啟用。該人工智能平臺(tái)集成飛星火大模型技術(shù),提供星火知識(shí)庫(kù)、星火紀(jì)要、
    的頭像 發(fā)表于 03-17 16:14 ?1008次閱讀

    北汽集團(tuán)與科大飛達(dá)成戰(zhàn)略合作

    近日,科大飛董事長(zhǎng)劉慶峰一行到訪北汽集團(tuán),與北汽集團(tuán)黨委書記、董事長(zhǎng)張建勇進(jìn)行座談交流,北汽集團(tuán)與科大飛簽署戰(zhàn)略合作框架協(xié)議,雙方將共同推動(dòng)汽車智能化領(lǐng)域的全方位戰(zhàn)略合作,依托先進(jìn)
    的頭像 發(fā)表于 03-04 10:28 ?815次閱讀

    科大飛Air 2電紙書和掌閱Ocean4 Plus區(qū)別

    ComfortLight Pro光源技術(shù),支持30級(jí)亮度和色溫調(diào)節(jié),夜間閱讀時(shí)眼睛也不會(huì)感到不適。 科大飛 Air 2 更多使用感受和評(píng)價(jià)https://u.jd.com/GGAOnEY 在性能方面
    發(fā)表于 03-03 14:01