chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

語音AI芯片演進至第三階段,誰將主宰下一個十年?

啟英泰倫 ? 2022-08-05 10:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

轉載自與非網

什么是語音AI芯片?

語音AI芯片,顧名思義是處理語音的AI芯片。很多人第一次接觸語音AI芯片可能是天貓精靈、小愛同學和小度等智能音箱產品,因為在這些產品中,我們可以體驗到智能語音的交互,而語音AI芯片是智能語音交互的基礎和核心。

都說這幾年AI芯片賽道很火,事實上語音識別、自然語義理解(NLP)和機器學習AI技術中占據(jù)重要的位置,是人機交互的基礎,而前兩項均與語音識別相關,這是因為語音識別不僅方便,而且是人機交互中最符合人類日常交流形態(tài)的一種技術,目前已經在智能家居和車載場景得到普遍應用。

為何語音識別要從云端搬至終端?

說到語音識別技術,還要追溯到2010年左右,當時以神經網絡為代表的AI技術使得智能語音識別成為可能,并在后來的IoT和AIoT產業(yè)浪潮中不斷走向成熟。

早期的智能語音識別受限于算力要求,終端沒有專用的芯片可以解決算力和功耗成本的均衡問題,無法在終端處理智能語音識別,而云端處理又憑借天然自帶內容和服務,模型可以快速迭代,數(shù)據(jù)收集和訓練非常方便等優(yōu)勢,決定了當時的語音識別大都是布置在云端的。

然而,云端的語音識別也有弊端,比如無法做到穩(wěn)定的實時響應,網絡崩潰時更是響應無門;重要的信息都要通過網絡傳輸,有被攻擊泄露的風險,無法保障用戶隱私安全;此外在成本方面也不具優(yōu)勢,除了持續(xù)的帶寬消耗外,云端語音需要后臺不間斷的運行大量服務器來做語音處理,服務器的購置、后續(xù)的硬件更換和軟件運維、人力費用和電費場地費等都非常昂貴。

9958de6a-143a-11ed-9ade-dac502259ad0.jpg

圖 | 為什么選擇離線語音

面對云端語音的優(yōu)劣勢,以啟英泰倫為代表的企業(yè)開始投入對端側語音識別的研究。不過,我們知道光有需求點還支撐不起一個新產業(yè)的崛起,要養(yǎng)活一個產業(yè)需要足夠的市場容量,實現(xiàn)資金的活流,才能有利于產品的不斷迭代,形成正向循環(huán)。

根據(jù)艾瑞咨詢發(fā)布數(shù)據(jù)顯示,2020年中國物聯(lián)網設備連接量達74億個,預計2025年將突破150億個。而麥肯錫則用更動態(tài)的數(shù)據(jù)表示出了物聯(lián)網的增長率,預估目前每秒大約有127臺設備連接到互聯(lián)網。

然而,面對當前物聯(lián)網的聯(lián)網量,華為給出了另一個數(shù)據(jù):當前大部分具備物聯(lián)能力的消費類設備只有 5% ~ 20% 的聯(lián)接激活率。這是為什么呢?究其原因,還是操作交互太過于復雜。而解決這個復雜問題的方法就是加入更多“老少皆宜”的語音配合IoT連接。

有行業(yè)內人士預測,語音AI芯片將會快速發(fā)展到5-10億顆/年左右的市場規(guī)模,隨著應用面的不斷拓寬和滲透率的不斷提升,該規(guī)模還將持續(xù)不斷提升。

綜上,不管是場景需求還是市場容量,都在推動端側語音識別的落地。但如何落地?不是一蹴而就的。

端側語音識別芯片的三個發(fā)展階段

語音識別面臨的挑戰(zhàn)和圖像識別不同,它對算力要求沒那么高,但對算法的要求很高。啟英泰倫創(chuàng)始人兼CEO何云鵬告訴與非網:“這是因為語音識別的應用場景非常多,所以各種噪聲就非常多樣,有穩(wěn)態(tài)噪聲,也有非穩(wěn)態(tài)噪聲,要在這些環(huán)境中進行高準確率的語音識別是非常困難的。所以,必須掌握智能語音算法全鏈條技術才能實現(xiàn)更好的語音識別,包括智能語音信號前端降噪處理、語音智能識別、語音合成、語音解碼、語音大數(shù)據(jù)處理及訓練、NLP等技術?!?/p>

當然,語音識別技術在國內的發(fā)展也是在不斷迭代中變得更加準確和靈活。我們以啟英泰倫的三代自研技術平臺BNPU(腦神經網絡處理器),來簡單概括端側語音AI芯片的這三個發(fā)展階段。

99752e44-143a-11ed-9ade-dac502259ad0.jpg

圖 | 啟英泰倫在語音AI芯片上的創(chuàng)新

階段一:語音識別功能

第一代BNPU芯片實現(xiàn)的是端側語音識別,是行業(yè)首款集成神經網絡處理器的語音AI芯片,也是離線語音產業(yè)應用興起的標志。

從集成度的角度來看,BNPU 1.0的方案相對分立,方案價格大約在50到90元左右(CI1006)。

階段二:離線聲紋識別+命令詞自學習

第二代BNPU芯片(CI1102/CI1103和CI1122),不僅實現(xiàn)了離線語音識別功能,還能實現(xiàn)離線聲紋識別和命令詞自學習等個性化的功能。在應用上,可以根據(jù)不同人的聲紋實現(xiàn)基于用戶個性喜好的功能配置,并能通過離線命令詞的自學習實現(xiàn)在輕度噪聲下的地方口音和方言的識別。

從集成度的角度來看,BNPU 2.0集成了Audio CODEC、Flash 等單元,以及雙麥陣增強處理能力,方案價格大約在15到25元左右。

階段三:深度降噪+深度分離+命令詞自學習2.0+離線NLP

第三代BNPU芯片,除了繼承第二代的語音識別、聲紋識別外,還支持了基于深度學習的降噪技術(深度降噪)、人聲分離技術(深度分離)、命令詞自學習2.0版本技術,以及行業(yè)首次突破性的離線NLP技術。在應用上,CI1301可以實現(xiàn)中等噪聲中的語音識別,而CI1302、CI1303、CI1306和CI1312則可實現(xiàn)強噪聲環(huán)境下的語音識別,比如當油煙機噪聲高達80dB時,對于70多dB的人聲依然可以良好識別。

從集成度的角度來看,BNPU 3.0不僅集成了Audio Codec的模擬 MIC接口、數(shù)字PDM麥克的DMIC接口、通用的ADCMCU常見的串口、PWM、GPIO等接口,還進一步集成了 4線Nor Flash、3路LDO的PMU和高精度的RC振蕩器等,方案價格約10元左右。

對于三代產品的方案價格一代更比一代低的疑問,何云鵬表示:“很多人認為離線語音在端側、數(shù)據(jù)處理、語音識別和存儲會產生很多的成本,實則云上的成本是持續(xù)的,傳輸?shù)某杀臼情L時間的,這個成本可以避免;此外,云端早期建設的成本很高,很多廠家會建不起,還有每年運營的成本,每臺設備每年10多元,這個費用在賣設備的時候廠商會包兩年,但后面就要客戶自己付費,所以不太公平。而隨著摩爾定律的發(fā)展,端側語音識別方案的整體成本已呈現(xiàn)30%的速率下降,已經達到了一個通用MCU的成本。”

除了價格以外,更值得一提的是,原本被認為只有云端才能實現(xiàn)的NLP,現(xiàn)在輕量級的NLP在端側智能語音芯片中也實現(xiàn)了,并且既保障了用戶的體驗感,又能降低云端搭建和運營成本,降低網絡帶寬消耗,也能提升用戶使用的安全性。

端云融合才是語音AI芯片的最終歸宿

當然,說云端搬到端側,實際上在很多場景下端側和云端不是非此即彼的關系,從長期來看,端側和云端是相互融合、相輔相成的關系。

隨著端側語音芯片功能、性能、可靠性變得越來越強大,價格越來越低,端側語音識別將實現(xiàn)可靠性、隱私保護、成本和靈活性等多方面的優(yōu)勢,再加上集成聯(lián)網功能可實現(xiàn)AIOT,從而實現(xiàn)大數(shù)據(jù)爆發(fā)時代下的有效數(shù)據(jù)分析和場景利用。

以空調為例,傳統(tǒng)的空調大都只有調溫的功能,但在差異化競爭的今天,大廠空調正在往機器人的方向發(fā)展,可以提供更多智慧化的服務,比如調整空氣的溫濕度、清新程度、含氧量、PM 2.5值,以及在早晨起床時放音樂營造氛圍、營養(yǎng)咨詢等。而這些服務的基礎是語音交互,并且一定是延遲更低、工作更穩(wěn)定的端側語音識別,而背后的服務交易、用戶的習慣大數(shù)據(jù)等則更適合放在云端,達到協(xié)同的效果。

寫在最后

國內語音AI芯片正呈現(xiàn)出爆發(fā)式增長的趨勢,誰將成為領頭者?何云鵬表示:“該市場領域未來發(fā)展壯大后,會呈現(xiàn)典型的頭部領先市場通吃的局面。而啟英泰倫在語料數(shù)據(jù)、算法模型、芯片架構、AI開發(fā)平臺及應用方案落地等多維度的迭代已經產生了馬太效應。經過長達近7年的發(fā)展后,啟英泰倫已經積累了B端客戶超過5000名,平臺開發(fā)者超過1萬名,使用啟英泰倫智能語音平臺的在校AI學員則超過10萬名。如今,整個離線語音行業(yè)快速發(fā)展,年內裝機量將突破2000萬臺,未來兩年,年出貨將朝著1億臺邁進。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    90

    文章

    38346

    瀏覽量

    297479
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    端到端語音交互革命:百度智能云聯(lián)合地瓜機器人,重塑AI陪伴體驗

    總監(jiān)孫穎欣在地瓜機器人的DDC2025 人機交互分論壇上指出,大模型時代的交互方式經歷了三個關鍵階段演進:第一階段是文本、語音交互第二
    發(fā)表于 12-01 01:07 ?1375次閱讀
    端到端<b class='flag-5'>語音</b>交互革命:百度智能云聯(lián)合地瓜機器人,重塑<b class='flag-5'>AI</b>陪伴體驗

    AI在此10 啟英泰倫成立10周啦!

    啟英泰倫成立十周年十年在科技奔騰不息的長河中不過瞬但對于中國AI語音產業(yè)而言這十年卻是
    的頭像 發(fā)表于 11-25 09:29 ?411次閱讀
    <b class='flag-5'>AI</b>在此10 啟英泰倫成立10周<b class='flag-5'>年</b>啦!

    李飛飛萬字長文:空間智能是AI下一個十年

    1950,當計算機不過是自動化算術和簡單邏輯的代名詞時,艾倫·圖靈提出了至今仍有回響的問題:機器能思考嗎?他以非凡
    的頭像 發(fā)表于 11-19 21:20 ?825次閱讀
    李飛飛萬字長文:空間智能是<b class='flag-5'>AI</b>的<b class='flag-5'>下一個</b><b class='flag-5'>十年</b>

    華為五大創(chuàng)新開啟非洲移動產業(yè)黃金十年

    、新商業(yè)、新聯(lián)接、新節(jié)能”五大場景化創(chuàng)新,攜手產業(yè)伙伴共同促進網絡領先、生態(tài)繁榮、服務普惠,開啟非洲移動產業(yè)下一個黃金十年。
    的頭像 發(fā)表于 11-14 16:23 ?1207次閱讀

    今日看點:我國已完成第一階段6G技術試驗;曝阿里秘密啟動“千問”項目對標ChatGPT 我國已完成第一階段

    我國已完成第一階段6G技術試驗 ? 據(jù)工業(yè)和信息化部消息,我國已連續(xù)四組織開展6G技術試驗,目前已完成第一階段6G技術試驗,形成超過300項關鍵技術儲備。6G是未來十年全球最重要的新
    發(fā)表于 11-14 10:08 ?1073次閱讀

    Wi-Fi FEM研發(fā),開啟第二十年

    轉載自《鐘林談芯》 人生如逆旅,我亦是行人。十年之旅,?起同行,?步步開花,Wi-Fi FEM研發(fā),我們開啟第二十年。 2015,在
    的頭像 發(fā)表于 11-12 15:37 ?259次閱讀
    Wi-Fi FEM研發(fā),開啟第二<b class='flag-5'>個</b><b class='flag-5'>十年</b>

    未來工業(yè)AI發(fā)展的三個必然階段

    與優(yōu)化 能力的深層革命。 未來十年,工業(yè)AI的發(fā)展將經歷三個清晰的階段:? 智能輔助 → 智能決策 → 自主優(yōu)化 。這次進化,構成了工業(yè)從
    的頭像 發(fā)表于 10-27 15:47 ?252次閱讀
    未來工業(yè)<b class='flag-5'>AI</b>發(fā)展的<b class='flag-5'>三個</b>必然<b class='flag-5'>階段</b>

    高通的AI新程,下一個激蕩三十年

    與中國共赴AI時代之約,高通已備好行囊
    的頭像 發(fā)表于 10-02 11:00 ?3179次閱讀
    高通的<b class='flag-5'>AI</b>新程,<b class='flag-5'>下一個</b>激蕩三<b class='flag-5'>十年</b>

    科技云報到:西湖大學、智元機器人都選它,存儲成為AI下一個風口

    科技云報到:西湖大學、智元機器人都選它,存儲成為AI下一個風口
    的頭像 發(fā)表于 09-03 11:24 ?547次閱讀

    十年積淀,DPVR AI眼鏡將正式亮相

    表示想要購買AI眼鏡。新的智能設備時代,正在打開。在這個節(jié)點,深耕XR領域十年的DPVR(大朋VR),將帶來它的首款AI智能眼鏡——DP
    的頭像 發(fā)表于 08-14 11:47 ?902次閱讀
    <b class='flag-5'>十年</b>積淀,DPVR <b class='flag-5'>AI</b>眼鏡將正式亮相

    36氪 | 從無到有的“聲”意經:智能語音芯片十年“平民化”演進

    解析,雖算力強大,卻存在響應延遲、依賴網絡、隱私顧慮等短板。而端側AI則將關鍵的處理能力“內置”于設備本身的芯片中,如同在設備上裝了即時響應的“大腦”。它能在
    的頭像 發(fā)表于 08-11 18:12 ?1102次閱讀
    36氪 | 從無到有的“聲”意經:智能<b class='flag-5'>語音</b><b class='flag-5'>芯片</b><b class='flag-5'>十年</b>“平民化”<b class='flag-5'>演進</b>

    AI玩具或成為下一個萬億新賽道

    如果你將擁有家庭新成員,你首先會想到什么?是孩子還是寵物?如果我說你下一個家庭成員,或許是會“察言觀色”的
    的頭像 發(fā)表于 07-29 10:15 ?940次閱讀

    【高云GW5AT-LV60 開發(fā)套件試用體驗】基于開發(fā)板進行深度學習實踐,并盡量實現(xiàn)皮膚病理圖片的識別,第三階段

    接上回,這次說第三階段的進展,直在想如何將cnn融合進高云以后的視頻案例里面,比如:下圖 上面圖中文件之間的關系應該是這樣的: 、 完整的視頻數(shù)據(jù)處理流程 根據(jù)這些文件名,我們
    發(fā)表于 07-06 15:18

    關于AI工廠三階段模型

    在今天(20255月20日)的Computex大會上,富士康董事長劉揚偉發(fā)表了以“AI工廠三階段模型”及“Genesis”為核心的Keynote演講,提到鴻海集團在AI轉型中的戰(zhàn)略布
    的頭像 發(fā)表于 05-20 23:26 ?1221次閱讀
    關于<b class='flag-5'>AI</b>工廠<b class='flag-5'>三階段</b>模型

    【「零基礎開發(fā)AI Agent」閱讀體驗】+初品Agent

    大模型落地的重要方向,也是AI技術的下一個風口。 因此該書適于對AI感興趣的讀者,尤其是Agent的學習者與開發(fā)者,如想要提升工作效率的職場人、推動企業(yè)AI深化應用的管理者、希望在
    發(fā)表于 04-22 11:51