chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

高通在2023年國際計算機(jī)視覺與模式識別會議上,展示先進(jìn)研究成果并將生成式AI引入邊緣側(cè)

高通中國 ? 來源:未知 ? 2023-06-27 19:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

6月18日至22日,IEEE/CVF國際計算機(jī)視覺與模式識別會議(CVPR)在溫哥華舉行,該會議不僅是計算機(jī)視覺,也是AI領(lǐng)域最重要的年度活動之一。會議期間,高通展示了已被業(yè)界認(rèn)可的研究論文和技術(shù)演示。本文將介紹CVPR 2023上高通的展示亮點(diǎn)。

技術(shù)演示

高通在AI、計算機(jī)視覺、XR和自動駕駛汽車等領(lǐng)域的研究,已從核心理論創(chuàng)新擴(kuò)展到下游實際應(yīng)用,例如:

·運(yùn)行在手機(jī)上的全球最快的

ControlNet演示

幾個月前,高通展示了全球首個運(yùn)行在Android手機(jī)上的Stable Diffusion終端側(cè)演示,該演示在CVPR上再次呈現(xiàn)。此外,高通AI研究演示了ControlNet圖像生成圖像模型,該模型擁有15億參數(shù),可以完全在手機(jī)上運(yùn)行。ControlNet是一項生成式AI解決方案,被稱為語言-視覺模型(LVM)。它能夠通過調(diào)整輸入圖像和輸入文本描述,更精準(zhǔn)地控制生成圖像。在這項演示中,只用不到12秒即可在移動終端上生成AI圖像,無需訪問任何云端,便能提供高效、有趣、可靠且私密的交互式用戶體驗。這項驚艷的技術(shù)演示通過一套跨模型架構(gòu)、AI軟件和神經(jīng)網(wǎng)絡(luò)硬件加速器的全棧式AI優(yōu)化而實現(xiàn)。在此過程中使用的高通先進(jìn)AI工具和硬件包括:高通AI模型增效工具包(AIMET)、高通AI軟件棧和高通AI引擎。

·支持基于實時視覺大語言模型的 健身教練 高通AI研究利用生成式AI打造出在準(zhǔn)確度和真實感方面超越現(xiàn)有解決方案的數(shù)字健身教練。健身教練能夠提供實時互動,鼓勵、糾正并幫助用戶實現(xiàn)其健身目標(biāo)。我們的演示展示了基于視覺的大語言模型如何支持情境式、多模態(tài)的實時交互。用戶的運(yùn)動視頻流先經(jīng)過動作識別模型進(jìn)行處理。根據(jù)識別的動作,狀態(tài)編排器(stateful orchestrator)提供提示并輸入給大語言模型。健身教練通過一個語音合成(文本生成語音)的虛擬化身,將大語言模型的答復(fù)送回給用戶。這項演示的實現(xiàn)主要?dú)w功于三項關(guān)鍵創(chuàng)新:為檢測精細(xì)化健身動作而訓(xùn)練的視覺模型、為生成基于視覺概念的語言而訓(xùn)練的語言模型,以及能夠協(xié)調(diào)兩個模態(tài)之間流動交互的編排器,便于實時對話式的輔導(dǎo)反饋。憑借上述創(chuàng)新,就能夠支持健身教練為用戶提供實時的沉浸式動態(tài)交互體驗。

·全球首個在手機(jī)上進(jìn)行的1080p

神經(jīng)網(wǎng)絡(luò)視頻編碼

終端側(cè)AI的另一項全球首創(chuàng)即在移動終端上的1080p視頻編碼和解碼過程。神經(jīng)網(wǎng)絡(luò)編解碼器用途十分廣泛:可針對特定視頻需求進(jìn)行定制,通過生成式AI的優(yōu)勢對感知質(zhì)量進(jìn)行優(yōu)化,擴(kuò)展至全新模態(tài),在通用AI硬件上運(yùn)行。但同時也將帶來難以在計算能力有限的終端上應(yīng)對的諸多挑戰(zhàn)。高通設(shè)計了全新高效的神經(jīng)網(wǎng)絡(luò)視頻幀間壓縮架構(gòu),支持在終端上進(jìn)行1080p視頻編碼。在演示中,神經(jīng)網(wǎng)絡(luò)視頻編解碼器能夠準(zhǔn)確地保留高清視頻的豐富視覺結(jié)構(gòu)和復(fù)雜動作。

·面向XR的3D重建

高通成功開發(fā)了先進(jìn)的實時3D重建系統(tǒng),該系統(tǒng)在準(zhǔn)確度和高效方面表現(xiàn)出色,能夠在任何環(huán)境下賦能創(chuàng)建高精度的3D模型。該解決方案在移動終端上運(yùn)行,從單個圖像生成深度圖,并將其組合成3D場景。有了準(zhǔn)確的實時3D地圖,開發(fā)者可以解鎖大量AR和VR應(yīng)用。全新設(shè)計的互動演示展示了高通的創(chuàng)新實力,用戶可向場景中的真實物體(比如墻壁和家具)射擊虛擬球,見證基于精確物理計算的逼真反彈效果。該感知技術(shù)提升了沉浸式體驗,并有望加速元宇宙的廣泛普及。

·面向智能攝像頭的計算機(jī)視覺

基于AI的計算機(jī)視覺的進(jìn)步,推動照片和視頻拍攝能力持續(xù)演進(jìn)。高通演示了語義分割、單目深度估測和基于實例分割的虛化效果、背景替換、電影模式,以及銳度、平滑度、清晰度與對比度方面相關(guān)的圖像質(zhì)量提升。這些神經(jīng)網(wǎng)絡(luò)在搭載驍龍平臺的終端上實時運(yùn)行視頻增強(qiáng)特性。

·為增強(qiáng)安全性的駕駛員監(jiān)測技術(shù)

駕駛員監(jiān)測系統(tǒng)(DMS)演示中展示了如何利用計算機(jī)視覺判斷危險駕駛狀況以提高安全性。駕駛員監(jiān)測系統(tǒng)通過座艙內(nèi)主動紅外攝像機(jī)實時監(jiān)測駕駛員的特征,如眼睛睜開程度、凝視方向、頭部姿勢、面部表情和肢體動作等,從而判斷駕駛員的駕駛狀態(tài)。該系統(tǒng)在檢測到類似注意力分散和瞌睡等危險駕駛情況時會向司機(jī)發(fā)出警告,最終幫助挽救生命。駕駛員監(jiān)測系統(tǒng)和先進(jìn)駕駛輔助系統(tǒng)(ADAS)能夠同時在Snapdragon Ride Flex系統(tǒng)級芯片上同步運(yùn)行。

·XR虛擬頭像

無論逼真或卡通風(fēng)格,虛擬化身是賦能元宇宙中沉浸式XR體驗的基本要素。借助一張或多張2D照片,利用終端側(cè)AI生成個性化網(wǎng)格和相應(yīng)的紋理。使用頭戴式攝像機(jī)來觀察用戶眼睛和嘴巴的移動,實時渲染虛擬頭像。由此,可生成更接近于標(biāo)準(zhǔn)現(xiàn)實重建和動畫后的虛擬化身,并根據(jù)環(huán)境進(jìn)行光照處理。高通的目標(biāo)是在元宇宙和人機(jī)界面中使用的驍龍XR平臺上提供數(shù)字人。

除了以上技術(shù)演示,高通還展示了公司已被業(yè)界認(rèn)可的研究論文。CVPR 2023期間,高通共有八篇論文被主會議收錄,主要從充分利用數(shù)據(jù)和打造更佳架構(gòu)兩大類別出發(fā),對推動計算機(jī)視覺前沿發(fā)展具有深遠(yuǎn)影響。

欲了解更多信息,請點(diǎn)擊【閱讀原文】。

*本文內(nèi)容來自高通技術(shù)公司工程技術(shù)副總裁Ning Bi、高通技術(shù)公司高級技術(shù)總監(jiān)Fatih Porikli的署名博客。

a9b9112a-14da-11ee-962d-dac502259ad0.gif ?


原文標(biāo)題:高通在2023年國際計算機(jī)視覺與模式識別會議上,展示先進(jìn)研究成果并將生成式AI引入邊緣側(cè)

文章出處:【微信公眾號:高通中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 高通
    +關(guān)注

    關(guān)注

    78

    文章

    7689

    瀏覽量

    198837
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    537

    瀏覽量

    1043

原文標(biāo)題:高通在2023年國際計算機(jī)視覺與模式識別會議上,展示先進(jìn)研究成果并將生成式AI引入邊緣側(cè)

文章出處:【微信號:Qualcomm_China,微信公眾號:高通中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    奧比中光3D視覺技術(shù)賦能IROS 2025研究成果

    全球機(jī)器人領(lǐng)域最具影響力的學(xué)術(shù)會議IROS 2025于10月19日至25日杭州國際博覽中心舉行。大會收錄的多篇論文的研究成果采用了奧比中光的3D
    的頭像 發(fā)表于 10-23 16:29 ?612次閱讀

    易控智駕榮獲計算機(jī)視覺頂會CVPR 2025認(rèn)可

    近日,2025國際計算機(jī)視覺模式識別頂級會議(IEEE/CVF Conference on
    的頭像 發(fā)表于 07-29 16:54 ?1015次閱讀

    NVIDIA展示機(jī)器人領(lǐng)域的研究成果

    今年的機(jī)器人科學(xué)與系統(tǒng)會議 (RSS) ,NVIDIA 研究中心展示了一系列推動機(jī)器人學(xué)習(xí)的研究成果
    的頭像 發(fā)表于 07-23 10:43 ?1156次閱讀

    Nullmax端到端自動駕駛最新研究成果入選ICCV 2025

    近日,國際計算機(jī)視覺大會 ICCV 2025 正式公布論文錄用結(jié)果,Nullmax 感知團(tuán)隊端到端自動駕駛方向的最新研究成果《HiP-AD
    的頭像 發(fā)表于 07-05 15:40 ?1593次閱讀
    Nullmax端到端自動駕駛最新<b class='flag-5'>研究成果</b>入選ICCV 2025

    后摩智能與高校合作研究成果榮獲ISCA 2025最佳論文獎

    》,成功榮獲第52屆計算機(jī)體系結(jié)構(gòu)國際研討會(ISCA)最佳論文獎。作為國內(nèi)學(xué)術(shù)機(jī)構(gòu)會議的首次獲獎
    的頭像 發(fā)表于 07-05 11:21 ?1924次閱讀

    理想汽車八篇論文入選ICCV 2025

    ,與CVPR(國際計算機(jī)視覺模式識別會議)、ECCV(歐洲計算機(jī)
    的頭像 發(fā)表于 07-03 13:58 ?875次閱讀

    基于LockAI視覺識別模塊:手寫數(shù)字識別

    手寫數(shù)字識別是一種經(jīng)典的模式識別和圖像處理問題,旨在通過計算機(jī)自動識別用戶手寫的數(shù)字。本文將教會你如何使用基于RV1106的LockAI視覺
    的頭像 發(fā)表于 06-30 15:44 ?901次閱讀
    基于LockAI<b class='flag-5'>視覺</b><b class='flag-5'>識別</b>模塊:手寫數(shù)字<b class='flag-5'>識別</b>

    NVIDIA榮獲CVPR 2025輔助駕駛國際挑戰(zhàn)賽冠軍

    NVIDIA 本周美國田納西州舉辦的國際計算機(jī)視覺模式識別會議(CVPR)
    的頭像 發(fā)表于 06-16 14:44 ?836次閱讀

    NVIDIAICRA 2025展示多項最新研究成果

    亞特蘭大舉行的國際機(jī)器人與自動化大會 (ICRA) ,NVIDIA 展示了其在生成
    的頭像 發(fā)表于 06-06 14:56 ?1176次閱讀

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機(jī)視覺的支持

    計算機(jī)視覺的支持,擴(kuò)大了當(dāng)前對音頻、雷達(dá)和其他時間序列信號數(shù)據(jù)的支持范圍。增加這項支持后,該平臺將能夠用于開發(fā)低功耗、低內(nèi)存的邊緣AI
    的頭像 發(fā)表于 03-11 15:11 ?678次閱讀
    英飛凌<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>平臺通過Ultralytics YOLO模型增加對<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>的支持

    Arm KleidiCV與OpenCV集成助力移動端計算機(jī)視覺性能優(yōu)化

    生成及多模態(tài)人工智能 (AI) 工作負(fù)載的廣泛增長,推動了對計算機(jī)視覺 (CV) 技術(shù)日益高漲的需求。此類技術(shù)能夠解釋并分析源自現(xiàn)實世界的
    的頭像 發(fā)表于 02-24 10:15 ?924次閱讀

    AI賦能邊緣網(wǎng)關(guān):開啟智能時代的新藍(lán)海

    引入徹底改變了這一局面。通過邊緣網(wǎng)關(guān)集成AI芯片和算法模型,使其具備了實時數(shù)據(jù)分析、智能決策和自主控制能力。工業(yè)質(zhì)檢場景中,搭載
    發(fā)表于 02-15 11:41

    NVIDIA JetPack 6.2引入Super模式

    NVIDIA Jetson Orin Nano Super 開發(fā)者套件的推出開創(chuàng)了小型邊緣設(shè)備生成 AI 的新時代。全新的 Super 模式
    的頭像 發(fā)表于 02-12 09:32 ?1726次閱讀
    NVIDIA JetPack 6.2<b class='flag-5'>引入</b>Super<b class='flag-5'>模式</b>

    通CES 2025展示AI創(chuàng)新成果

    近日,萬眾矚目的2025國際消費(fèi)電子展(CES 2025)通技術(shù)公司大放異彩,宣布了一系列行業(yè)領(lǐng)先的
    的頭像 發(fā)表于 01-09 14:26 ?873次閱讀

    耐能亮相CES 2025,展示側(cè)AI最新成果

    能向全球市場展示了其側(cè)AI技術(shù)的最新進(jìn)展。作為全球邊緣
    的頭像 發(fā)表于 01-08 14:58 ?1275次閱讀