語音識別芯片也稱為語音識別IC。 與傳統(tǒng)語音芯片相比,語音識別芯片的較大特點是可以識別語音。 它使機器可以理解人的聲音,并可以根據(jù)命令執(zhí)行各種操作,例如眨眼,張開嘴(智能娃娃)。 此外,語音識別芯片還具有高質(zhì)量,高壓縮率的記錄和回放功能,可以實現(xiàn)人機對話。
語音識別芯片涉及的技術(shù)包括:信號處理,模式識別,概率論和信息論,聲音機制和聽覺機制,人工智能等。根據(jù)用戶的限制,語音識別芯片可以分為特定人語音識別芯片和非特定人語音識別芯片。
特定人的語音識別
特定人語音識別芯片用于指定人的語音識別。 如果無法識別其他人,則用戶的語音參考樣本必須作為比較數(shù)據(jù)庫存儲在數(shù)據(jù)庫中,也就是說,特定人的語音識別必須在使用前進(jìn)行語音訓(xùn)練,通常按照機器提示將語音輸入訓(xùn)練兩次 用它。
獨立于人的語音識別
獨立于人的語音識別是一種識別技術(shù),只要使用相同的語言,無論年齡或性別,都無需針對指定的人。 應(yīng)用模式是根據(jù)確定產(chǎn)品之前確定的十幾個語音交互條目來收集大約200個人。 通過PC算法對PC的語音樣本進(jìn)行處理,以獲得交互式條目的語音模型和特征數(shù)據(jù)庫,然后刻錄到芯片上。 使用該芯片的機器(智能娃娃,電子寵物,兒童計算機)具有交互功能。
一些與人無關(guān)的語音識別應(yīng)用程序基于音素算法。 在這種模式下,無需收集很多人的語音樣本就可以進(jìn)行交互式識別,但缺點是識別率不高,識別性能不穩(wěn)定。
根據(jù)說話方式的連續(xù)性,語音識別芯片可分為不連續(xù)語音識別和連續(xù)語音識別。
語音識別芯片選型方案
WTK6900G-24SS是一款本地觸發(fā)引擎的語音識別芯片,具有低成本、高可靠性、通用性強的特點。在語音技術(shù)上實現(xiàn)了高可靠的喚醒識別率、更遠(yuǎn)距離的喚醒、更低誤喚醒率、更豐富的語音控制指令條數(shù)、更強的抗噪音能力、更快的響應(yīng)識別時間,免聯(lián)網(wǎng)的純離線識別。主要應(yīng)用在智能家電(白電、廚電、生活電器、小家電等)智能衛(wèi)浴、智能照明、智能機電、智能家居、酒店客控等;
審核編輯:符乾江
電子發(fā)燒友App



































































評論