chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌研究人員利用3D卷積網(wǎng)絡打造視頻生成新系統(tǒng)

DPVg_AI_era ? 來源:lq ? 2019-06-02 09:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌研究人員利用3D卷積網(wǎng)絡打造視頻生成新系統(tǒng),只需要視頻的第一幀和最后一幀,就能生成完整合理的整段視頻,是不是很神奇?

漫畫書秒變動畫片了解一下?

想象一下,現(xiàn)在你的手中有一段視頻的第一幀和最后一幀圖像,讓你負責把中間的圖像填進去,生成完整的視頻,從現(xiàn)有的有限信息中推斷出整個視頻。你能做到嗎?

這可能聽起來像是一項不可能完成的任務,但谷歌人工智能研究部門的研究人員已經(jīng)開發(fā)出一種新系統(tǒng),可以由視頻第一幀和最后一幀生成“似是而非的”視頻序列,這個過程被稱為“inbetween”。

“想象一下,如果我們能夠教一個智能系統(tǒng)來將漫畫自動變成動畫,會是什么樣子?如果真實現(xiàn)了這一點,無疑將徹底改變動畫產業(yè)。“該論文的共同作者寫道。“雖然這種極其節(jié)省勞動力的能力仍然超出目前最先進的水平,但計算機視覺機器學習技術的進步正在使這個目標的實現(xiàn)越來越接近?!?/p>

原理與模型結構

這套AI系統(tǒng)包括一個完全卷積模型,這是是受動物視覺皮層啟發(fā)打造的深度神經(jīng)網(wǎng)絡,最常用于分析視覺圖像。它由三個部分組成:2D卷積圖像解碼器,3D卷積潛在表示生成器,以及視頻生成器。

圖1:視頻生成模型示意圖

圖像解碼器將來自目標視頻的幀映射到潛在空間,潛在表示生成器學習對包含在輸入幀中的信息進行合并。最后,視頻生成器將潛在表示解碼為視頻中的幀。

研究人員表示,將潛在表示生成與視頻解碼分離對于成功實現(xiàn)中間視頻至關重要,直接用開始幀和結束幀的編碼表示生成視頻的結果很差。為了解決這個問題,研究人員設計了潛在表示生成器,對幀的表示進行融合,并逐步增加生成視頻的分辨率。

圖2:模型生成的視頻幀序列圖,對于每個數(shù)據(jù)集上方的圖表示模型生成的序列,下方為原視頻,其中首幀和尾幀用于生成模型的采樣。

實驗結果

為了驗證該方法,研究人員從三個數(shù)據(jù)集中獲取視頻 - BAIR機器人推送,KTH動作數(shù)據(jù)庫和UCF101動作識別數(shù)據(jù)集 - 并將這些數(shù)據(jù)下采樣至64 x 64像素的分辨率。每個樣本總共包含16幀,其中的14幀由AI系統(tǒng)負責生成。

研究人員為每對視頻幀運行100次模型,并對每個模型變量和數(shù)據(jù)集重復10次,在英偉達Tesla V100顯卡平臺上的訓練時間約為5天。結果如下表所示:

表1:我們報告了完整模型和兩個基線的平均FVD,對每個模型和數(shù)據(jù)集重復10次,每次運行100個epoch,表中FVD值越低,表示對應生成視頻的質量越高。

表2:使用直接3D卷積和基于的替代方法的模型的平均SSIM

RNN(SDVI)或光流(SepConv和SuperSloMo),數(shù)值越高越好。

研究人員表示,AI生成的視頻幀序列在風格上與給定的起始幀和結束幀保持一致,而且看上去說得通。“令人驚喜的是,這種方法可以在如此長的時間段內實現(xiàn)視頻生成,”該團隊表示,“這可能給未來的視頻生成技術研究提供了一個有用的替代視角?!?/p>

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1218

    瀏覽量

    43247
  • 谷歌
    +關注

    關注

    27

    文章

    6252

    瀏覽量

    111213
  • 智能系統(tǒng)

    關注

    2

    文章

    420

    瀏覽量

    74259

原文標題:谷歌AI動畫接龍:只用頭尾兩幀圖像,片刻生成完整視頻!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    2D材料3D集成實現(xiàn)光電儲備池計算

    先進材料與三維集成技術的結合為邊緣計算應用帶來了新的可能性。本文探討研究人員如何通過單片3D集成方式將硒化銦光電探測器與二硫化鉬憶阻晶體管結合,實現(xiàn)傳感器與計算單元之間物理距離小于50納米的緊密集成[1]。
    的頭像 發(fā)表于 02-02 15:58 ?174次閱讀
    2<b class='flag-5'>D</b>材料<b class='flag-5'>3D</b>集成實現(xiàn)光電儲備池計算

    技術資訊 I 多板系統(tǒng) 3D 建模,提升設計精度和性能

    本文要點了解3D建模流程。洞悉多板系統(tǒng)3D建模如何提高設計精度、性能和成本效益。掌握3D建模在制造工藝中的優(yōu)勢。在PCBA領域,仿真與建模是實現(xiàn)精準高效設計的基石。在量產前構建并復用原
    的頭像 發(fā)表于 11-21 17:45 ?2499次閱讀
    技術資訊 I 多板<b class='flag-5'>系統(tǒng)</b> <b class='flag-5'>3D</b> 建模,提升設計精度和性能

    全球首個動漫專屬AI視頻生成平臺Animon,國內版&quot;萌動AI&quot;正式發(fā)布

    Animon國內版——"萌動AI"首秀:AI動漫創(chuàng)作進入全民時代 北京2025年9月25日?/美通社/ -- CreateAI(OTC:TSPH)今日宣布,其打造的全球首個專注于動漫的AI視頻生成
    的頭像 發(fā)表于 09-25 12:33 ?919次閱讀

    玩轉 KiCad 3D模型的使用

    “ ?本文將帶您學習如何將 3D 模型與封裝關聯(lián)、文件嵌入,講解 3D 查看器中的光線追蹤,以及如何使用 CLI 生成 PCBA 的 3D 模型。? ” ? 在日常的 PCB 設計中,
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉 KiCad <b class='flag-5'>3D</b>模型的使用

    索尼與VAST達成3D業(yè)務合作

    與Tripo AI的高精度3D生成能力,打造從內容創(chuàng)作到沉浸式展示的全鏈路解決方案。此次合作將推動3D技術在展覽、零售、教育等場景的普惠化應用,同時也將為元宇宙、工業(yè)設計、數(shù)字孿生等領
    的頭像 發(fā)表于 08-28 17:32 ?1345次閱讀

    生成式 AI 重塑自動駕駛仿真:4D 場景生成技術的突破與實踐

    生成式AI驅動的4D場景技術正解決傳統(tǒng)方法效率低、覆蓋不足等痛點,如何通過NeRF、3D高斯?jié)姙R等技術實現(xiàn)高保真動態(tài)建模?高效生成極端天氣等長尾場景?本文為您
    的頭像 發(fā)表于 08-06 11:20 ?5123次閱讀
    <b class='flag-5'>生成</b>式 AI 重塑自動駕駛仿真:4<b class='flag-5'>D</b> 場景<b class='flag-5'>生成</b>技術的突破與實踐

    TechWiz LCD 3D應用:FFS仿真

    建模任務 堆棧結構 建模過程 2.1使用TechWiz Layout繪制各層掩模版平面圖 2.2創(chuàng)建堆棧結構,并生成3D結構 2.3 使用TechWiz LCD 3D進行各項參數(shù)計算 3
    的頭像 發(fā)表于 07-14 14:08 ?648次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應用:FFS仿真

    無刷直流電機雙閉環(huán)串級控制系統(tǒng)仿真研究

    以來伴隨著永磁材料技術、計算機及控制技術等支撐技術的快速發(fā)展及微電機制造工藝水平的不斷提高,永磁無刷直流電動機在高性能中、小伺服驅動領域獲得廣泛應用并日趨占據(jù)主導地位嗎。一直以來,研究人員都比較關注利用
    發(fā)表于 07-07 18:36

    4K、多模態(tài)、長視頻:AI視頻生成的下一個戰(zhàn)場,誰在領跑?

    電子發(fā)燒友網(wǎng)報道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無縫切換的1080P高品質
    的頭像 發(fā)表于 06-16 00:13 ?7242次閱讀

    3D AD庫文件

    3D庫文件
    發(fā)表于 05-28 13:57 ?6次下載

    VirtualLab Fusion應用:3D系統(tǒng)可視化

    描述和F-Theta透鏡的應用示例。 光學系統(tǒng)3D-可視化 VirtualLab Fusion提供的工具可以實現(xiàn)光學系統(tǒng)3D可視化,因此可以用于檢查元件的位置,以及快速了解
    發(fā)表于 04-30 08:47

    NVIDIA助力影眸科技3D生成工具Rodin升級

    在當今數(shù)字化與 AI 飛速發(fā)展的時代,3D 生成技術正逐漸成為推動各行業(yè)創(chuàng)新的關鍵力量。影眸科技(上海)有限公司專注于 3D 生成領域的探索,積極推動領先實驗室科研成果的民用化、商業(yè)化
    的頭像 發(fā)表于 04-27 15:09 ?1270次閱讀

    VirtualLab Fusion應用:光學系統(tǒng)3D可視化

    Results Profile提供有關傳播光線的信 息,而后者只顯示組件和探測器。 在接下來的使用案例中,我們將重點介紹 System:3D視圖。 系統(tǒng):Ray Results Profile的3D視圖
    發(fā)表于 04-02 08:42

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個關鍵組件,它在端側幫助可以幫助智能體理解環(huán)境信息,在云端可以用來輔助生成3D場景和3D標簽,具備重要的
    的頭像 發(fā)表于 03-17 13:44 ?1201次閱讀
    一種以圖像為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>

    ?超景深3D檢測顯微鏡技術解析

    為一個完整的三維模型。這種技術不僅提升了成像的精度,還大大擴展了顯微鏡的應用范圍。 在材料科學領域,超景深3D檢測顯微鏡為研究人員提供了觀察材料微觀結構的強大工具。例如,在納米材料的研究中,科學家可以
    發(fā)表于 02-25 10:51