chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺析語(yǔ)音識(shí)別技術(shù)的發(fā)展歷程

汽車(chē)玩家 ? 來(lái)源:旺龍ITLONG、eepw、個(gè)人圖書(shū) ? 作者:旺龍ITLONG、eepw、個(gè) ? 2022-02-07 10:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語(yǔ)音識(shí)別,通常稱(chēng)為自動(dòng)語(yǔ)音識(shí)別,主要是將人類(lèi)語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,也有可能是按鍵、二進(jìn)制編碼或者字符序列。但是,我們一般理解的語(yǔ)音識(shí)別其實(shí)都是狹義的語(yǔ)音轉(zhuǎn)文字的過(guò)程,簡(jiǎn)稱(chēng)語(yǔ)音轉(zhuǎn)文本識(shí)別,主要是識(shí)別和確認(rèn)發(fā)出語(yǔ)音的人而非其中所包含的內(nèi)容。

語(yǔ)音識(shí)別的目的就是讓機(jī)器聽(tīng)懂人類(lèi)口述的語(yǔ)言,包括了兩方面的含義:一是逐字逐句聽(tīng)懂而不是轉(zhuǎn)化成書(shū)面的語(yǔ)言文字;二是對(duì)口述語(yǔ)言中所包含的命令或請(qǐng)求加以領(lǐng)會(huì),做出正確回應(yīng),而不僅僅只是拘泥于所有詞匯的正確轉(zhuǎn)換。

語(yǔ)音識(shí)別系統(tǒng)根據(jù)對(duì)輸入語(yǔ)音的限制分類(lèi),可以將識(shí)別系統(tǒng)分為三類(lèi):

①特定人語(yǔ)音識(shí)別系統(tǒng),僅考慮對(duì)于專(zhuān)人的話(huà)音進(jìn)行識(shí)別。

②非特定人語(yǔ)音系統(tǒng),識(shí)別的語(yǔ)音與人無(wú)關(guān),通常要用大量不同人的語(yǔ)音數(shù)據(jù)庫(kù)對(duì)識(shí)別系統(tǒng)進(jìn)行學(xué)習(xí)。

③多人的識(shí)別系統(tǒng),通常能識(shí)別一組人的語(yǔ)音,或者成為特定組語(yǔ)音識(shí)別系統(tǒng),該系統(tǒng)僅要求對(duì)要識(shí)別的那組人的語(yǔ)音進(jìn)行訓(xùn)練。

根據(jù)從說(shuō)話(huà)的方式考慮,也可以將識(shí)別系統(tǒng)分為三類(lèi):

①孤立詞語(yǔ)音識(shí)別系統(tǒng),孤立詞識(shí)別系統(tǒng)要求輸入每個(gè)詞后要停頓。

②連接詞語(yǔ)音識(shí)別系統(tǒng),連接詞輸入系統(tǒng)要求對(duì)每個(gè)詞都清楚發(fā)音,一些連音現(xiàn)象開(kāi)始出現(xiàn)。

③連續(xù)語(yǔ)音識(shí)別系統(tǒng),連續(xù)語(yǔ)音輸入是自然流利的連續(xù)語(yǔ)音輸入,大量連音和變音會(huì)出現(xiàn)。

在過(guò)去5-10年,隨著技術(shù)快速迭代,語(yǔ)音識(shí)別市場(chǎng)在我國(guó)得到飛快發(fā)展,目前處于深度神經(jīng)網(wǎng)絡(luò)階段。如今,語(yǔ)音識(shí)別主流廠(chǎng)商主要使用端到端的算法,在實(shí)驗(yàn)環(huán)境準(zhǔn)確率可高達(dá)99%以上,為推動(dòng)新基建發(fā)展,5G、人工智能、云計(jì)算等作為輔助核心基礎(chǔ)設(shè)施的核心技術(shù)得到進(jìn)一步加速發(fā)展,帶動(dòng)語(yǔ)音識(shí)別迎來(lái)迎來(lái)了更加廣闊的發(fā)展空間,智能家居智能音箱、智能車(chē)載和智能硬件等等都得到很好的廣泛應(yīng)用。

語(yǔ)音識(shí)別主要趨于遠(yuǎn)場(chǎng)化和融合化的方向發(fā)展,但在遠(yuǎn)場(chǎng)可靠性還有很多難點(diǎn)沒(méi)有突破,比如多輪交互、多人噪雜等場(chǎng)景還有待突破,還有需求較為迫切的人聲分離等技術(shù)。新的技術(shù)應(yīng)該徹底解決這些問(wèn)題,讓機(jī)器聽(tīng)覺(jué)遠(yuǎn)超人類(lèi)的感知能力。這不能僅僅只是算法的進(jìn)步,需要整個(gè)產(chǎn)業(yè)鏈的共同技術(shù)升級(jí),包括更為先進(jìn)的傳感器和算力更強(qiáng)的芯片。

單從遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別技術(shù)來(lái)看,仍然存在很多挑戰(zhàn),包括:

回聲消除技術(shù)。由于喇叭非線(xiàn)性失真的存在,單純依靠信號(hào)處理手段很難將回聲消除干凈,這也阻礙了語(yǔ)音交互系統(tǒng)的推廣,現(xiàn)有的基于深度學(xué)習(xí)的回聲消除技術(shù)都沒(méi)有考慮相位信息,直接求取的是各個(gè)頻帶上的增益,能否利用深度學(xué)習(xí)將非線(xiàn)性失真進(jìn)行擬合,同時(shí)結(jié)合信號(hào)處理手段可能是一個(gè)好的方向。

噪聲下的語(yǔ)音識(shí)別仍有待突破。信號(hào)處理擅長(zhǎng)處理線(xiàn)性問(wèn)題,深度學(xué)習(xí)擅長(zhǎng)處理非線(xiàn)性問(wèn)題,而實(shí)際問(wèn)題一定是線(xiàn)性和非線(xiàn)性的疊加,因此一定是兩者融合才有可能更好地解決噪聲下的語(yǔ)音識(shí)別問(wèn)題。

語(yǔ)音識(shí)別的目的是讓機(jī)器可以理解人類(lèi),因此轉(zhuǎn)換成文字并不是最終的目的,如何將語(yǔ)音識(shí)別和語(yǔ)義理解結(jié)合起來(lái)可能是未來(lái)更為重要的一個(gè)方向。語(yǔ)音識(shí)別里的LSTM已經(jīng)考慮了語(yǔ)音的歷史時(shí)刻信息,但語(yǔ)義理解需要更多的歷史信息才能有幫助,因此如何將更多上下文會(huì)話(huà)信息傳遞給語(yǔ)音識(shí)別引擎是一個(gè)難題。

讓機(jī)器聽(tīng)懂人類(lèi)語(yǔ)言,僅靠聲音信息還不夠,“聲光電熱力磁”這些物理傳感手段,下一步必然都要融合在一起,只有這樣機(jī)器才能感知世界的真實(shí)信息,這是機(jī)器能夠?qū)W習(xí)人類(lèi)知識(shí)的前提條件;而且,機(jī)器必然要超越人類(lèi)的五官,能夠看到人類(lèi)看不到的世界,聽(tīng)到人類(lèi)聽(tīng)不到的世界。

未來(lái),相信在國(guó)家政策的強(qiáng)力扶持下,能夠加速在垂直行業(yè)的滲透和布局,也相信在供應(yīng)商和開(kāi)發(fā)者共同努力下,語(yǔ)音識(shí)別技術(shù)能夠更好地與其他語(yǔ)音交互技術(shù)及軟件功能融合,為消費(fèi)者提供更優(yōu)質(zhì)的體驗(yàn)。

文章整合自:旺龍ITLONG、eepw、個(gè)人圖書(shū)館

審核編輯:鄢孟繁

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1814

    瀏覽量

    116224
  • 機(jī)器
    +關(guān)注

    關(guān)注

    0

    文章

    799

    瀏覽量

    41932
  • 二進(jìn)制編碼
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    3411
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    語(yǔ)音識(shí)別芯片介紹,語(yǔ)音識(shí)別芯片工作原理解析

    在智能交互不斷深入的今天,語(yǔ)音識(shí)別芯片正成為眾多設(shè)備實(shí)現(xiàn)語(yǔ)音控制與AI對(duì)話(huà)的關(guān)鍵部件。語(yǔ)音芯片廣義上涵蓋語(yǔ)音播放、錄音及
    的頭像 發(fā)表于 04-01 16:26 ?181次閱讀

    語(yǔ)音識(shí)別芯片的功能與優(yōu)勢(shì)有哪些

    在智能語(yǔ)音交互快速發(fā)展的今天,語(yǔ)音識(shí)別芯片作為核心部件,正逐漸成為各類(lèi)智能設(shè)備不可或缺的組成部分。一款優(yōu)秀的語(yǔ)音
    的頭像 發(fā)表于 03-30 15:31 ?138次閱讀

    瑞芯微(EASY EAI)RV1126B 語(yǔ)音識(shí)別

    1.語(yǔ)音識(shí)別簡(jiǎn)介語(yǔ)音識(shí)別技術(shù),也被稱(chēng)為自動(dòng)語(yǔ)音識(shí)別
    的頭像 發(fā)表于 01-21 10:43 ?1012次閱讀
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>

    語(yǔ)音識(shí)別IC分類(lèi),語(yǔ)音識(shí)別芯片的工作原理

    語(yǔ)音識(shí)別芯片,也叫語(yǔ)音識(shí)別集成電路,是一種集聲音存儲(chǔ)、播放、錄音及語(yǔ)音識(shí)別功能于一體的專(zhuān)用芯片。
    的頭像 發(fā)表于 01-14 15:22 ?370次閱讀
    <b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>IC分類(lèi),<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>芯片的工作原理

    國(guó)產(chǎn)32位MCU語(yǔ)音識(shí)別方案

    在智能家居、工業(yè)控制及便攜設(shè)備領(lǐng)域,語(yǔ)音交互正成為人機(jī)界面的重要發(fā)展方向。針對(duì)離線(xiàn)語(yǔ)音識(shí)別需求,基于國(guó)產(chǎn)32位MCU的解決方案日益成熟,其中以CH32V307等為代表的32位MCU芯片
    的頭像 發(fā)表于 12-04 15:11 ?665次閱讀

    語(yǔ)音識(shí)別芯片有哪些(語(yǔ)音識(shí)別芯片AT680系列)

    在人工智能技術(shù)飛速發(fā)展的今天,語(yǔ)音識(shí)別芯片作為人機(jī)交互的重要橋梁,正逐漸成為各類(lèi)智能設(shè)備不可或缺的核心部件。與傳統(tǒng)的語(yǔ)音芯片不同,
    的頭像 發(fā)表于 11-14 17:11 ?1503次閱讀

    廣州唯創(chuàng)電子WTK6900H-24SS語(yǔ)音識(shí)別芯片:智能語(yǔ)音控制賦能臺(tái)燈創(chuàng)新應(yīng)用 | 語(yǔ)音IC廠(chǎng)家

    在智能家居快速發(fā)展的今天,語(yǔ)音交互技術(shù)正在深刻改變?nèi)藗兣c家居設(shè)備的互動(dòng)方式。臺(tái)燈作為日常生活中不可或缺的照明工具,其智能化升級(jí)已成為行業(yè)發(fā)展的重要趨勢(shì)。廣州唯創(chuàng)電子作為國(guó)內(nèi)領(lǐng)先的
    的頭像 發(fā)表于 11-05 09:20 ?924次閱讀
    廣州唯創(chuàng)電子WTK6900H-24SS<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>芯片:智能<b class='flag-5'>語(yǔ)音</b>控制賦能臺(tái)燈創(chuàng)新應(yīng)用 | <b class='flag-5'>語(yǔ)音</b>IC廠(chǎng)家

    什么是離線(xiàn)語(yǔ)音識(shí)別芯片(離線(xiàn)語(yǔ)音識(shí)別芯片有哪些優(yōu)點(diǎn))

    離線(xiàn)語(yǔ)音識(shí)別芯片,是一種集成了語(yǔ)音信號(hào)采集、前端處理和本地識(shí)別功能的專(zhuān)用集成電路,無(wú)須聯(lián)網(wǎng)也可以進(jìn)行語(yǔ)音控制。它內(nèi)設(shè)先進(jìn)的數(shù)字信號(hào)處理模塊及
    的頭像 發(fā)表于 10-31 15:27 ?644次閱讀

    如何選擇合適的語(yǔ)音識(shí)別芯片型號(hào)

    語(yǔ)音識(shí)別芯片(又稱(chēng)語(yǔ)音識(shí)別IC)是現(xiàn)代智能設(shè)備的核心組件,與傳統(tǒng)語(yǔ)音芯片相比,其最大特點(diǎn)是能夠主動(dòng)識(shí)別
    的頭像 發(fā)表于 10-30 16:32 ?713次閱讀

    廣州唯創(chuàng)電子WTK6900H-32N語(yǔ)音識(shí)別芯片:AI降噪算法助力抽油煙機(jī)精準(zhǔn)語(yǔ)音控制 | 語(yǔ)音IC廠(chǎng)家

    在現(xiàn)代智能家居快速發(fā)展的大背景下,廚房作為家庭生活的重要場(chǎng)景,其智能化程度卻一直受到環(huán)境噪音的制約。抽油煙機(jī)作為廚房核心電器,其運(yùn)行產(chǎn)生的噪音往往使得傳統(tǒng)語(yǔ)音識(shí)別技術(shù)難以發(fā)揮效用。廣州
    的頭像 發(fā)表于 10-30 09:17 ?495次閱讀
    廣州唯創(chuàng)電子WTK6900H-32N<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>芯片:AI降噪算法助力抽油煙機(jī)精準(zhǔn)<b class='flag-5'>語(yǔ)音</b>控制 | <b class='flag-5'>語(yǔ)音</b>IC廠(chǎng)家

    語(yǔ)音識(shí)別系統(tǒng)的技術(shù)核心:從聲音到文字的智能轉(zhuǎn)換

    ? ? ? 語(yǔ)音識(shí)別技術(shù),也稱(chēng)為自動(dòng)語(yǔ)音識(shí)別(ASR),其核心目標(biāo)是將人類(lèi)語(yǔ)音信號(hào)轉(zhuǎn)換為對(duì)應(yīng)的文
    的頭像 發(fā)表于 09-05 14:04 ?985次閱讀

    瑞芯微RK3576語(yǔ)音識(shí)別算法

    1.語(yǔ)音識(shí)別簡(jiǎn)介語(yǔ)音識(shí)別技術(shù),也被稱(chēng)為自動(dòng)語(yǔ)音識(shí)別
    的頭像 發(fā)表于 08-15 15:13 ?2415次閱讀
    瑞芯微RK3576<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>算法

    語(yǔ)音識(shí)別---大家怎么看呢?

    語(yǔ)音識(shí)別是一門(mén)交叉學(xué)科。近二十年來(lái),語(yǔ)音識(shí)別技術(shù)取得顯著進(jìn)步,開(kāi)始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì),未來(lái)10年內(nèi),
    發(fā)表于 08-09 10:54

    語(yǔ)音識(shí)別芯片選型有哪些技術(shù)參數(shù)要注意

    語(yǔ)音識(shí)別芯片的使用場(chǎng)景越來(lái)越多涉及的范圍也越來(lái)越廣!那么語(yǔ)音芯片的選型就很重要了,選型不對(duì)直接影響產(chǎn)品的使用體驗(yàn),下面小編從不同的維度來(lái)給大家介紹語(yǔ)音
    的頭像 發(fā)表于 06-23 17:31 ?1040次閱讀
    <b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>芯片選型有哪些<b class='flag-5'>技術(shù)</b>參數(shù)要注意

    明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    源的開(kāi)發(fā)資料為開(kāi)發(fā)者提供了深入研究和定制語(yǔ)音機(jī)器人功能的基礎(chǔ),開(kāi)發(fā)者可以根據(jù)不同的應(yīng)用需求,對(duì)語(yǔ)音識(shí)別算法、語(yǔ)音合成引擎等進(jìn)行優(yōu)化和改進(jìn)。一對(duì)一的
    發(fā)表于 05-28 11:36