chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音交互只是處于自動駕駛的L1級階段

電子工程師 ? 來源:未知 ? 作者:胡薇 ? 2018-11-05 16:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2017 年可以看做是智能語音交互的元年,在這一年里小愛同學、天貓精靈紛紛上市。2018 年里語音交互的落地突然加速,落地的產(chǎn)品從大公司關(guān)注的智能音箱擴展到其它品類,比如電視盒子、鬧鐘、燈、智能馬桶等。那接下來語音交互會如何發(fā)展?

▌?wù)Z音交互的終極目標

語音交互的便利程度正好與人工智能的發(fā)展程度成正比,智能程度越高語音交互的等級也就越高,所以其終極形態(tài)與人工智能的終極形態(tài)類似。

如果拋棄特別夸張的想象來說,那語音交互要能達成《她》或者《黑鏡》里描述的樣子:

當你輸入數(shù)據(jù)給它后,它能夠根據(jù)輸入數(shù)據(jù)表現(xiàn)出不同的個性。

在數(shù)據(jù)的處理上它近乎是全能的,只受個人權(quán)限的限制。

如果真的賦予實體,那它可以感知周圍環(huán)境并作出與人類似但很多方面會更優(yōu)秀的反應(yīng)。

今天的智能音箱和未來相對終極的語音交互方式以及設(shè)備相比,其差距要遠大于 X86 電腦和今天 Pad 的差距。

一旦發(fā)展成以上這樣的程度,那語音交互就會徹底地打開邊界,而不只是我們使用數(shù)據(jù)的一種方式,甚至會成為生活的必須品。我們不會對 iPhone 產(chǎn)生依戀,但語音交互則會。

回顧下《黑鏡》里描述的場景,可以對此有更好的理解:

女主人公的丈夫去世,過于思念自己丈夫的女主人公通過公開的自己丈夫的數(shù)據(jù)創(chuàng)建了一個有性格的,屬于自己的語音交互機器人。這個機器人在絕大多數(shù)方面表現(xiàn)和女主丈夫一致。女主使用一段時間后,就升級了這服務(wù),為這語音交互機器人賦予了和自己丈夫一樣的形體。

這看著非常科幻,但實際上一旦語音交互達到上述程度,那這類事情幾乎一定發(fā)生。既然我們能接受很宅并愿意躲在家里,那就一定能接受這樣一種非真實、但更完美的電子助手進入心靈的世界。《她》這部電影雖然沒拍,但如果有為個性化語音交互系統(tǒng)塑形的服務(wù),主人公也一定會接受。

在這里反倒是互聯(lián)網(wǎng)限制了我們的想象力,因為互聯(lián)網(wǎng)更多體現(xiàn)的只是工具的屬性,但實際上語音交互系統(tǒng)所涵蓋的范圍要比互聯(lián)網(wǎng)大的多。當前之所以能做的還不多,主要是層級還不夠。

▌?wù)Z音交互的L1、L2、L3

我們可以這樣定義語音交互的 L1 階段:

能以極高的準確率,在典型的環(huán)境下響應(yīng)用戶的語音輸入。極高的準確率最低應(yīng)該在 90%+。這時承載語音交互的設(shè)備主要負責功能性的提示與反饋(燈與屏幕等)。

當前所有與語音相關(guān)的公司,事實上都是在達成 L1 的路上。L1 的出口為語音交互習慣徹底樹立,人們面對每款設(shè)備的時候會首先想到用語音操作,而不是遙控器或者屏幕。

在 L1 階段語音交互更像是自動化程度、精準程度更高的搜索,但搜索的范圍擴大了,不單是局限于已有的數(shù)字內(nèi)容,也擴展到家電、視頻通話等正常搜索不會覆蓋的領(lǐng)域。

我們可以這樣定義 L2 階段:

能以極高的準確率識別出交互的當事人和環(huán)境,然后進行個性化的交互。這時承載語音交互的設(shè)備通過攝像頭等傳感器能夠?qū)崟r感知,進行適當移動,初步擬人。

L2 階段體現(xiàn)的是個性化,不再是千人一面。如果 L2 得以達成,那《她》所描述的場景是可以實現(xiàn)的。語音交互可以定制出性格,而這種性格很可能確實滿足某個人的心理期待。

在 L2 階段,語音交互會打破工具的邊界,嘗試走入從來沒被搜索等介入的領(lǐng)域,比如排遣寂寞?,F(xiàn)在的各種 App 是按照領(lǐng)域來切分的,而在 L2 階段,所有 App 的邊界會被打破,信息的輸出是按照人來切分的。也就是說不再有 BAT、頭條、美團等,只有張三的語音交互助理,李四的語音交互助理。

我們可以這樣定義 L3 階段:

只要有數(shù)據(jù),語音交互系統(tǒng)的能力就可以無邊界擴展(包括個性和能力)。交互設(shè)備可以進行擬人化輸出。

L3 階段體現(xiàn)的是后端內(nèi)容擴展的無邊界特性,不再是有多少智能就有多少人工,以及擬人化輸出。擬人化輸出包括移動、說話的語調(diào)、風格、姿態(tài)等。

如果 L3 階段得以實現(xiàn),那《黑鏡》描述的場景是可以實現(xiàn)的。只要有一個人充分的數(shù)據(jù)描述,就可以立刻模擬這個人,然后賦予他一個真實的身體。

在 L3 階段,語音交互及其載體,將是社會生活、甚至家庭的一部分。

本質(zhì)上,從 L1 到 L3 體現(xiàn)的是數(shù)字化和智能程度不斷加深,同時數(shù)字和智能又按照人類的理想形態(tài)進行物化的過程。這一過程也是完全顛覆基于手機的移動互聯(lián)網(wǎng)的過程。

▌?wù)Z音交互發(fā)展的核心障礙

整個行業(yè)迫切需要徹底解決下面的問題:

解決前端聲學適配問題,否則變成每個設(shè)備都需要調(diào)整,但真正能對其調(diào)整的人員很少。

NLP 整合足夠全的內(nèi)容資源,開發(fā)出缺省的 Killer App,因為產(chǎn)品公司不可能系統(tǒng)地在產(chǎn)品周期內(nèi)整合所有內(nèi)容。

落地方式多樣化(包括純軟件、模組的)。語音交互和移動應(yīng)用的根本不同是需要面對多種多樣的設(shè)備,所以其自身的落地形態(tài)必須是靈活的。

眼下不同產(chǎn)品公司的訴求差別很大,小公司希望的是 turn-key 的方案,有內(nèi)容的公司希望的是自己做部分 NLP,偏行業(yè)的公司希望的是有帶硬件可貼牌的產(chǎn)品、但自己開發(fā)手機 App,諸如此類。

因為用戶需求的復(fù)雜性,落地是一個相對長跑且需要保持靈活的過程,不同產(chǎn)品公司需求的內(nèi)核是一樣的,但處理大品牌客戶總是需要靈活處理很多細節(jié)。這對于創(chuàng)業(yè)公司難度不大,但對巨頭會形成難以跨越的障礙。

▌未來三年必然會達成的成績

現(xiàn)在與語音交互相關(guān)的公司,核心在做的就是 L1 階段的事。這個階段雖然在人工智能的大趨勢里面,但本質(zhì)上智能并沒那么關(guān)鍵,關(guān)鍵的是便利以及能輸出的內(nèi)容。這兩者會推動樹立語音交互這種習慣。

如果要在數(shù)量級上進行判斷的話,那三年后可以達成的目標是:

每年有 10 億臺支持語音交互的設(shè)備售出。

至少故事機、電視機、電視盒子、汽車前后裝、白色家電、燈、鬧鐘等會加入這種特性。手機、Pad、電腦這些大品類上語音交互的能力則會變成標配,但使用頻次估計需要更長的時間進行提升。在最初,交互頻次會很差(這點在前文已提及),語音交互本身并非一種獨立的交互方式,而是同其背后的內(nèi)容深度綁定,我們很多的應(yīng)用實際上是針對手機和鍵盤鼠標操作優(yōu)化過的。

凡是電子設(shè)備都可以用語音來進行交互。

語音交互不會挑設(shè)備,同之前的交互相比,它可以更加低廉,理論上只要麥克風并且能聯(lián)網(wǎng)就足夠了。相較于給設(shè)備加入鍵盤鼠標或者屏幕,這個成本要低很多。這點上做出表率的仍然是亞馬遜,亞馬遜不停地推出新的設(shè)備,如微波爐、車載設(shè)備等。當然不同設(shè)備上語音交互的層次是不同的,有些設(shè)備如白色家電,語音交互會限制在一到三輪以內(nèi)。

在更高一級的視角下,當前的所有努力本質(zhì)作用就一個:通過便利性樹立語音交互的習慣。但是,習慣背后跟隨的是用戶時間,二者又會為下面的進一步發(fā)展提供試驗田。只有達成了這一目標,從技術(shù)到產(chǎn)品再到用戶這一循環(huán)才算真正完成了第一次迭代。

▌結(jié)語

語音交互看著太簡單了,不過是說話而已,所以很容易被誤解為,像說話一樣的交互就是現(xiàn)在語音交互設(shè)備所應(yīng)該能干的事。其實不是,語音交互的從 L1 到 L3 有可能比自動駕駛從 L1 到 L5 還要漫長。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49807

    瀏覽量

    262226
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    339

    瀏覽量

    29076

原文標題:語音交互只是說話?相比自動駕駛它還在L1級!

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    L3自動駕駛即將全面商用,眾車企蓄勢待發(fā)

    依據(jù)。 ? 到了2024年底,《北京市自動駕駛汽車條例》通過,自2025年4月1日起施行,明確了L3自動駕駛汽車在北京市的測試和運營規(guī)則。與此同時,《武漢市智能網(wǎng)聯(lián)汽車發(fā)展促進條例》也
    的頭像 發(fā)表于 01-18 00:57 ?7851次閱讀

    L3自動駕駛落地!磁性元件企業(yè)如何突圍

    近日,工信部正式發(fā)放我國首批 L3 自動駕駛車型準入許可,長安牌與北汽藍谷極狐牌兩款車型率先在北京、重慶試點。這一里程碑事件標志著自動駕駛從測試走向商用,而作為核心零部件“能量傳輸與
    的頭像 發(fā)表于 12-19 11:29 ?196次閱讀
    <b class='flag-5'>L</b>3<b class='flag-5'>級</b><b class='flag-5'>自動駕駛</b>落地!磁性元件企業(yè)如何突圍

    北汽集團自動駕駛產(chǎn)品安全開發(fā)保障體系建設(shè)與實踐

    12月15日,北汽集團旗下極狐阿爾法S(L3版)正式獲批工業(yè)和信息化部自動駕駛車型產(chǎn)品準入許可,即將在北京市限定區(qū)域內(nèi)開展L3有條件自動駕駛
    的頭像 發(fā)表于 12-18 15:06 ?263次閱讀

    北汽集團旗下極狐汽車獲批工信部L3自動駕駛車型產(chǎn)品準入許可

    12月15日,北汽集團旗下極狐阿爾法S(L3版)正式獲批工業(yè)和信息化部自動駕駛車型產(chǎn)品準入許可,即將在北京市限定區(qū)域內(nèi)開展L3有條件自動駕駛
    的頭像 發(fā)表于 12-18 15:00 ?282次閱讀

    L4自動駕駛數(shù)據(jù)采集系統(tǒng)首選

    引言:自動駕駛數(shù)據(jù)采集的核心挑戰(zhàn) 隨著L4自動駕駛技術(shù)進入商業(yè)化落地階段,如何高效采集并處理海量多源傳感器數(shù)據(jù)成為行業(yè)痛點??抵\科技推出的
    的頭像 發(fā)表于 11-26 09:31 ?264次閱讀

    NVIDIA與Uber合作推進全球L4自動駕駛移動出行網(wǎng)絡(luò)

    NVIDIA 宣布與 Uber 達成合作,將共同擴展全球 L4 自動駕駛移動出行網(wǎng)絡(luò)。合作將依托 Uber 新一代無人駕駛出租車和自動配送
    的頭像 發(fā)表于 11-03 14:33 ?1089次閱讀

    批準L3自動駕駛上路意味著什么?

    的一句話,卻為自動駕駛行業(yè)未來發(fā)展打開了一個可控的通道,即在承認技術(shù)成熟的同時,在明確邊界、嚴格驗證與配套監(jiān)管下穩(wěn)步推進L3自動駕駛發(fā)展,使得L
    的頭像 發(fā)表于 09-16 09:28 ?552次閱讀
    批準<b class='flag-5'>L</b>3<b class='flag-5'>級</b><b class='flag-5'>自動駕駛</b>上路意味著什么?

    邊聊安全 | 以L3自動駕駛為例,詳解DDT、DDT Fallback、MRC、MRM概念

    L3自動駕駛為例,詳解DDT、DDTFallback、MRC、MRM概念寫在前面:在自動駕駛技術(shù)迅猛發(fā)展的今天,動態(tài)駕駛任務(wù)(DDT)及
    的頭像 發(fā)表于 09-05 16:20 ?3052次閱讀
    邊聊安全 | 以<b class='flag-5'>L</b>3<b class='flag-5'>級</b><b class='flag-5'>自動駕駛</b>為例,詳解DDT、DDT Fallback、MRC、MRM概念

    自動駕駛達到什么技術(shù)標準才能稱為L3

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛技術(shù)時,常會陷入兩個極端,一方面是大家對“完全自動駕駛”的美好愿景,另一方面是自動駕駛技術(shù)飛速發(fā)展過程中對于“安全隱患”的擔憂。L3
    的頭像 發(fā)表于 08-21 10:37 ?1639次閱讀
    <b class='flag-5'>自動駕駛</b>達到什么技術(shù)標準才能稱為<b class='flag-5'>L</b>3<b class='flag-5'>級</b>?

    佑駕創(chuàng)新車規(guī)L4自動駕駛小巴獲項目定點

    近日,深圳佑駕創(chuàng)新科技股份有限公司(2431.HK)宣布,其采用車規(guī)方案的L4自動駕駛小巴獲得中國電信股份有限公司無人小巴項目定點,并將于二季度完成交付。標志著佑駕創(chuàng)新
    的頭像 發(fā)表于 05-13 17:09 ?1603次閱讀

    L0到L5自動駕駛技術(shù)的演進階段

    高盛(Goldman Sachs)估計,到2030年,L3自動駕駛汽車或占全球新車銷量的10%。自動駕駛汽車需要經(jīng)過多達6個層級的技術(shù)演進,才能最終實現(xiàn)上路自主
    的頭像 發(fā)表于 04-24 10:42 ?1216次閱讀

    產(chǎn)業(yè)鏈起飛!L3自動駕駛年內(nèi)有望落地

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)近幾個月,關(guān)于L3自動駕駛落地的聲音越來越多。 ? 小鵬汽車董事長何小鵬在社交媒體透露,2025年底將推出真L3
    發(fā)表于 03-13 00:22 ?1705次閱讀

    佑駕創(chuàng)新成功交付L4自動駕駛小巴項目

    近日,深圳佑駕創(chuàng)新科技股份有限公司(股票代碼:2431.HK)在蘇州圓滿完成了基于“車路云一體化”技術(shù)的L4自動駕駛小巴項目交付。這一里程碑事件標志著佑駕創(chuàng)新在自動駕駛領(lǐng)域取得了重大
    的頭像 發(fā)表于 02-17 10:55 ?1535次閱讀

    伊予鐵巴士公司啟動L4自動駕駛公交商業(yè)運營

    近日,據(jù)報道,日本松山市的伊予鐵巴士公司正式啟動了“Level 4”(即L4)自動駕駛公交巴士的商業(yè)運營。這一舉措標志著自動駕駛技術(shù)在公
    的頭像 發(fā)表于 12-27 10:50 ?1387次閱讀