chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI精確復(fù)制聲音, 真假“比爾·蓋茨”難辨

Gv1N_smartman16 ? 來源:yxw ? 2019-06-15 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日, 臉書的研究人員成功克隆了微軟總裁比爾·蓋茨的聲音。

臉書人工智能研究中心的肖恩·瓦斯奎茲(Sean Vasquez)和邁克·劉易斯(Mike Lewis)于本周表示,他們已經(jīng)努力模仿人類語言有一段時(shí)間了。然而,模仿人類語言顯然是件難事,當(dāng)人們聽到斯蒂芬·霍金所使用的那套最著名的說話機(jī)器發(fā)聲時(shí),會(huì)發(fā)現(xiàn)它聽起來仍然很不像人類。

但是現(xiàn)在,研究員們似乎已經(jīng)取得了進(jìn)展。如果你聽了蓋茨的克隆所發(fā)出的聲音,我想你是會(huì)同意的。因?yàn)樗犉饋砗芟癖葼枴どw茨,你甚至很難分辨出它和他真實(shí)聲音的區(qū)別。

研究人員展示了他們的研究。在這里,機(jī)器模仿著蓋茨的腔調(diào)發(fā)聲,“請(qǐng)給你珍愛的朋友發(fā)一封充滿愛意的短信?!逼渲凶畈豢伤甲h的是,這臺(tái)機(jī)器在說“珍愛(cherish)”時(shí),準(zhǔn)確無誤地捕捉到蓋茨不斷上升的語調(diào)變化的。

這項(xiàng)技術(shù)被稱為MelNet,可以用來復(fù)制人類的語調(diào)。到目前為止,蓋茨和其他許多人的聲音都被它完美地再現(xiàn)了。瓦斯奎茲和劉易斯說,克隆的音頻取自各類Ted演講。

兩位研究人員還表示,直到最近,文本到語音轉(zhuǎn)換軟件還不能很好地工作的原因是它使用了波形圖記錄聲音。這些圖顯示了聲音在幾秒鐘內(nèi)的音階變化。如果你聽到過蓋茨說“珍愛”這個(gè)詞,就知道他的語氣是變化劇烈的。在試圖模仿一個(gè)人的時(shí)候,深度學(xué)習(xí)機(jī)器必須預(yù)測(cè)到所有這些細(xì)微的變化,這很不容易。

瓦斯奎茲和劉易斯說,他們通過使用一種叫做光譜圖的東西來訓(xùn)練機(jī)器,成功地克隆了聲音。

研究人員說:“光譜圖的時(shí)間軸比波形圖的時(shí)間軸緊湊幾個(gè)數(shù)量級(jí),這意味著在波形中跨越數(shù)萬個(gè)時(shí)間步長(zhǎng)的依賴關(guān)系在光譜圖中只跨越數(shù)百個(gè)時(shí)間步長(zhǎng)。這使得我們的光譜圖模型能夠在數(shù)秒內(nèi)記錄各種語音和音樂樣本,并保持它們一致性?!?/p>

不過,他們也經(jīng)歷了一些挫折。研究小組表示,對(duì)他們來說,幾乎完美地復(fù)制一個(gè)句子并不難,難的是復(fù)制那些在長(zhǎng)達(dá)幾十秒或幾分鐘的時(shí)間里,顯示了情緒變化的復(fù)雜語調(diào)”。盡管如此,當(dāng)涉及到人機(jī)交互時(shí),研究小組說,在只涉及簡(jiǎn)短對(duì)話的情境中,這項(xiàng)技術(shù)可能會(huì)帶來革命性的變化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39540

    瀏覽量

    301088
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8551

    瀏覽量

    136841
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    825

    瀏覽量

    50249

原文標(biāo)題:AI精確復(fù)制聲音, 真假“比爾·蓋茨”難辨

文章出處:【微信號(hào):smartman163,微信公眾號(hào):網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何查看小智是否成功進(jìn)入聲音設(shè)置?

    你可以通過后臺(tái)頁面狀態(tài)、設(shè)備反饋、語音測(cè)試三種方式,快速確認(rèn)小智是否成功進(jìn)入聲音設(shè)置并生效。 一、后臺(tái)頁面直接查看(最準(zhǔn)) 登錄小智AI后臺(tái):https://xiaozhi.me/console
    發(fā)表于 02-16 06:39

    Transformer 入門:從零理解 AI 大模型的核心原理

    : 身高:175cm 體重:70kg 年齡:25歲 我們可以把這些數(shù)字排成一排:[175, 70, 25],這就是一個(gè)向量! arduino 體驗(yàn)AI代碼助手 代碼解讀 復(fù)制代碼 向量就像一張
    發(fā)表于 02-10 16:33

    使用NORDIC AI的好處

    運(yùn)動(dòng)/手勢(shì)識(shí)別、可穿戴健康監(jiān)測(cè)、預(yù)測(cè)性維護(hù)、樓宇與工業(yè)傳感網(wǎng)絡(luò)本地分析、聲音/關(guān)鍵詞/圖像識(shí)別等,都有官方明確提到的典型用例。[Unlock Edge AI 博客; Nordic Edge AI 技術(shù)頁]
    發(fā)表于 01-31 23:16

    純4G?血版AI小智產(chǎn)品方案 #小智AI #AI方案商 #4G通話 #AI終端產(chǎn)品

    AI
    不太正經(jīng)的攻城獅
    發(fā)布于 :2025年12月21日 14:36:55

    IC聲音放大芯片怎么焊接區(qū)分啊,好小感覺四面都一樣?

    想做一個(gè)簡(jiǎn)單的基于ESP32的AI語音識(shí)別助手,焊接好的聲音輸出一直是000。
    發(fā)表于 12-09 22:08

    VS680 HDMI AI分析解決方案 #目標(biāo)識(shí)別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導(dǎo)體
    發(fā)布于 :2025年11月12日 10:29:33

    【CPKCOR-RA8D1】關(guān)于AI人臉檢測(cè)移植遇到的一些問題

    /MainLoop_obj.cc、src/ai_apps/common/Main.cc 等文件已復(fù)制到項(xiàng)目并未被排除在構(gòu)建之外。 確認(rèn)工程配置包含 C++ 編譯器 設(shè)置,并在 C++ 編譯選項(xiàng)加入 -std=c++11(或更高
    發(fā)表于 10-31 13:39

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識(shí)盲區(qū)
    發(fā)表于 10-14 07:14

    釋放聲音的維度:高性能評(píng)估板為沉浸式音頻體驗(yàn)快速便捷構(gòu)建聲場(chǎng)工具

    A316-V71-Game-V1是一款基于XMOS XU316技術(shù)的虛擬7.1游戲聲卡評(píng)估平臺(tái),能夠?qū)⒘Ⅲw聲音頻轉(zhuǎn)換為虛擬7.1聲道環(huán)繞聲,為游戲玩家提供身臨其境的音頻體驗(yàn),幫助精確定位游戲中的聲音方向。
    的頭像 發(fā)表于 09-30 14:14 ?452次閱讀
    釋放<b class='flag-5'>聲音</b>的維度:高性能評(píng)估板為沉浸式音頻體驗(yàn)快速便捷構(gòu)建聲場(chǎng)工具

    如何進(jìn)行聲音定位?

    文章主要介紹了如何利用一種簡(jiǎn)單的TDOA算法進(jìn)行聲音點(diǎn)位,并使用數(shù)據(jù)采集卡進(jìn)行聲音定位的實(shí)驗(yàn)。
    的頭像 發(fā)表于 09-23 15:47 ?1760次閱讀
    如何進(jìn)行<b class='flag-5'>聲音</b>定位?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    復(fù)制人類智能的AI---AGI。 走向AGI的五個(gè)層次發(fā)現(xiàn)階段: ①L1,聊天機(jī)器人:具備基礎(chǔ)的對(duì)話能力,能夠理解和回應(yīng)簡(jiǎn)單的文本輸入 ②L2,推理者:具備基本的邏輯推理能力,能夠分析復(fù)雜信息并進(jìn)行推斷
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎(jiǎng)級(jí)別的假設(shè)哦。 AI驅(qū)動(dòng)科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個(gè)范式了,與實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)、數(shù)據(jù)驅(qū)動(dòng)科學(xué)一起構(gòu)成
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實(shí)現(xiàn)。 而大腦是一個(gè)由無數(shù)神經(jīng)元通過突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上就是一臺(tái)濕潤(rùn)的軟組織
    發(fā)表于 09-06 19:12

    聲源定位模塊-AR1105# 聲源定位# 聲音定位

    聲音降噪
    深圳市聲訊電子有限公司
    發(fā)布于 :2025年08月01日 16:01:09

    正點(diǎn)原子 AI BOX0 智能伴侶,1.54寸高清屏+長(zhǎng)效續(xù)航,語音暢聊,情景對(duì)話,知識(shí)科普,多色可選,隨身攜帶!

    品非它莫屬! 為什么選擇小智AI? 真人級(jí)交互體驗(yàn) ① AI情感對(duì)話:不止問答,更能陪你聊心事、講笑話,像朋友一樣懂你! ② 10+音色百變:溫柔御姐、萌趣童聲、磁性男神… 每天換一種聲音陪伴
    發(fā)表于 04-24 16:11