chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MLPerf V2.0推理結果放榜,NVIDIA表現(xiàn)搶眼

荷葉塘 ? 來源:電子發(fā)燒友 ? 作者:程文智 ? 2022-04-15 22:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文/程文智)不久前,AI性能基準評測平臺MLPerf公布了2022年首次推理(Inference v2.0)測試成績,NVIDIA的AI平臺表現(xiàn)依然搶眼。

據(jù)MLPerf官方介紹,它是由來自學術界、研究實驗室和相關行業(yè)的 AI 領導者組成的聯(lián)盟,旨在“構建公平和有用的基準測試”,在規(guī)定的條件下,針對硬件、軟件和服務的訓練和推理性能提供公平的評估。每年組織AI推理和AI訓練測試各兩次,以對迅速增長的AI計算需求與性能進行及時的跟蹤測評。MLPerf比賽通常分為固定任務(Closed)和開放優(yōu)化(Open)兩類任務,開放優(yōu)化能力著重考察參測廠商的AI技術創(chuàng)新力,固定任務則因更公平地考察參測廠商的硬件系統(tǒng)和軟件優(yōu)化的能力,成為更具參考價值的AI性能基準測試。因此,目前MLPerf被看作是AI領域的風向標,誰能夠在這個測試中取得更多的領先,誰的AI能力就越突出。


在最新一期的榜單中,浪潮、NVIDIA、英特爾、高通、阿里巴巴、戴爾、Deci.ai、Azure、富士通、技嘉、聯(lián)想、寧暢、美超微、華碩、浙江實驗室、及新華三等廠商參與了競賽。評測以最新MLPerf Inference V2.0為基準,涵蓋了圖像分類、目標檢測、醫(yī)療圖像分割、自然語言處理、語音轉文字和推薦系統(tǒng)6類AI應用場景,分為數(shù)據(jù)中心和邊緣兩類處理場景,每類場景都包含固定任務(Closed)和開放優(yōu)化(Open)兩類性能競賽。其中,在最新的V2.0規(guī)范中,在邊緣運算環(huán)境導入多資料流(Multi Stream)測試項目,測量邊緣運算設備在多攝影機、多傳感器場景的性能表現(xiàn),以得到更貼近真實使用情況的數(shù)據(jù)。


據(jù)統(tǒng)計,本輪測試一共展示了超過3900 次性能測試和 2200 次功耗測試,分別是上一輪的2倍和6倍。根據(jù)公開的數(shù)據(jù)顯示,本次測試中除了戴爾科技、富士通、技嘉、浪潮、聯(lián)想、寧暢和美超微等外,華碩和新華三本次測試中首次使用了NVIDIA AI平臺提交MLPerf結果。

Jetson AGX Orin提升邊緣AI性能,取得不俗成績

值得一提的是基于NVIDIA Ampere架構的低功耗系統(tǒng)級芯片NVIDIA Orin首次參加MLPerf基準測試,就取得了不俗的成績。在邊緣AI領域,NVIDIA Orin預生產(chǎn)版本在六項性能測試中的五項處于領先地位,其運行速度比上一代Jetson AGX Xavier快了5倍,能效平均提高了2倍。


根據(jù)NVIDIA官網(wǎng)的介紹,Jetson AGX Orin 系列有32GB和64GB兩個版本,該系列具有高達275TOPS的AI性能,由 Ampere GPU深度學習加速器 (DLA) 提供支持。CPU配備了多達12個Arm Cortex A78AE內核。

Orin配備了其第三代Tensor Cores,可提高性能并支持稀疏矩陣。基于NVIDIA為 Xavier 所做的多處理器構建,它不僅具有 GPU 和CPU,還具有其他處理器,可以幫助從GPU和CPU卸載應用程序的某些部分。它包括一個專用于 AI 應用的深度學習加速器、一個用于計算機視覺應用和ISP的視覺加速器,以及一個視頻解碼和視頻編碼引擎。與 Xavier 相比,NVIDIA還為 Orin 帶來了 LPDDR5 以提高帶寬,傳輸速度可達204.8GB/s。 Orin 還具備豐富的IO連接,比如其具有多達22個PCIe4.0通道、4個千兆以太網(wǎng)、16個MIPI CSI通道,以及各種其他傳感器接口等。


根據(jù)測試,Jetson AGX Orin提供了8倍于Jetson AGX Xavier的性能,Jetson AGX Orin是能夠運行所有六項MLPerf基準測試的邊緣加速器。憑借JetPack SDK,Orin可以運行整個NVIDIA AI平臺,這個軟件堆棧已經(jīng)在數(shù)據(jù)中心和云端得到了驗證,并且獲得了NVIDIA Jetson平臺100萬名開發(fā)者的支持。


在應用方面,目前,Orin主要關注三大領域,分別為:工業(yè)、自動駕駛和醫(yī)療。Orin現(xiàn)已加入到用于機器人和自動化系統(tǒng)的NVIDIA Jetson AGX Orin開發(fā)者套件。包括亞馬遜網(wǎng)絡服務、約翰迪爾、小松、美敦力和微軟Azure在內的6000多家客戶使用NVIDIA Jetson平臺進行AI推理或其他任務。

Orin也是NVIDIA Hyperion自動駕駛汽車平臺的關鍵組成部分。據(jù)NVIDIA介紹,Orin可處理在自動駕駛汽車和機器人中同時運行的大量應用和深度神經(jīng)網(wǎng)絡,并且達到了ISO 26262 ASIL-D 等系統(tǒng)安全標準。而且,比亞迪近期已經(jīng)宣布,他們將在其新一代自動駕駛電動汽車中使用內置Orin的DRIVE Hyperion架構。

Orin同樣也是NVIDIA Clara Holoscan醫(yī)療設備平臺的關鍵組成部分,且該平臺可供系統(tǒng)制造商和研究人員用來開發(fā)新一代AI儀器。

NVIDIA其他AI成果

除了Orin之外,本輪MLPerf,驗證了NVIDIA的多項成果,包括多實例GPU(MIG)、TensorRT等。比如MIG可提升每個 NVIDIA A100 Tensor 核心 GPU 的性能和價值。MIG可將 A100 GPU 劃分為多達七個實例,每個實例均與各自的高帶寬顯存、緩存和計算核心完全隔離。管理員可以支持從大到小的各項工作負載,為每項工作提供規(guī)模適當?shù)?GPU,而且服務質量 (QoS) 穩(wěn)定可靠,從而優(yōu)化利用率,讓每位用戶都能享用加速計算資源。


而根據(jù)實際測試結果,在使用7個實例時的性能為僅用一個實例的98%,這也意味著MIG可以充分利用GPU,避免了算力的浪費。


軟件是性能提升的關鍵驅動因素,NVIDIA在AI推理方面的軟件包括了用于優(yōu)化 AI 模型的 NVIDIA TensorRT 和用于有效部署它們的 NVIDIA Triton開源推理服務軟件。NVIDIA AI 推理和云高級產(chǎn)品經(jīng)理David Salvator在媒體發(fā)布會上介紹了NVIDIA的Triton開源推理服務軟件。


目前TensorRT廣泛的優(yōu)化GPU內核庫已支持Jetson Orin,MLPerf中使用的插件已全部移植到Orin并添加到 TensorRT 8.4。Triton則Kubernetes緊密集成,可以管理GPU以及x86和Arm CPU上的AI推理工作,NVIDIA宣布,Triton現(xiàn)在可以只在CPU上運行,而無需GPU。

而也正是因為NVIDIA的跨平臺管理能力,使A100在Arm和x86-64平臺上的性能幾乎相同。并且,通過NVIDIA的軟件優(yōu)化,AI性能在過去一年中就增長了高達50%。

結語

這幾年,NVIDIA在AI領域一路狂奔,不僅僅在數(shù)據(jù)中心方面優(yōu)勢明顯,在汽車、邊緣計算方面也正推出優(yōu)勢產(chǎn)品,另外在他們還在準備推出工業(yè)級的AI產(chǎn)品,進入傳統(tǒng)工業(yè)領域。AI正在不斷滲透到人們生活的各個方面。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5513

    瀏覽量

    109180
  • AI
    AI
    +關注

    關注

    90

    文章

    38346

    瀏覽量

    297481
  • 人工智能
    +關注

    關注

    1813

    文章

    49793

    瀏覽量

    262042
  • 推理
    +關注

    關注

    0

    文章

    9

    瀏覽量

    7406
  • MLPerf
    +關注

    關注

    0

    文章

    37

    瀏覽量

    946
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    智子科技發(fā)布數(shù)字營銷策略大模型智小虎V2.0

    11月28日,2025(第十三屆)數(shù)字營銷峰會暨CAAC數(shù)字營銷專業(yè)委員會十周年慶典及第17屆虎嘯獎啟動儀式在北京舉行。在本次大會上,由智子科技、南京大學、虎嘯獎三方聯(lián)合打造的“智小虎”V2.0正式發(fā)布。
    的頭像 發(fā)表于 12-05 16:54 ?934次閱讀

    項目效率翻倍!迅為RK3568?V2.0硬件接口升級,開發(fā)流程再提速

    項目效率翻倍!迅為RK3568?V2.0硬件接口升級,開發(fā)流程再提速
    的頭像 發(fā)表于 10-29 10:53 ?257次閱讀
    項目效率翻倍!迅為RK3568?<b class='flag-5'>V2.0</b>硬件接口升級,開發(fā)流程再提速

    嵌入式入門必看!迅為RK3568?V2.0升級,新手也能輕松玩轉

    嵌入式入門必看!迅為RK3568?V2.0升級,新手也能輕松玩轉
    的頭像 發(fā)表于 10-28 13:26 ?211次閱讀
    嵌入式入門必看!迅為RK3568?<b class='flag-5'>V2.0</b>升級,新手也能輕松玩轉

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造的推理框架,核心目標是突破 NVIDIA 平臺上的推理性能瓶頸。為實
    的頭像 發(fā)表于 10-21 11:04 ?820次閱讀

    華為推出人工智能氣象預報模型V2.0版本

    華為全聯(lián)接大會2025期間,在氣象海洋論壇上,華為聯(lián)合重慶市氣象局、云輯數(shù)科發(fā)布“天資·12h”人工智能氣象預報模型(V2.0),助力成渝地區(qū)氣象災害精準防御、城市安全運行與高質量發(fā)展。
    的頭像 發(fā)表于 09-20 14:34 ?1722次閱讀

    使用env v2.0執(zhí)行scons --dist產(chǎn)生缺失依賴報錯怎么解決?

    使用env v2.0版本的工具到rt-thread &gt; v5.1.0版本的bsp中使用scons指令,會出現(xiàn)缺失packages依賴的報錯,并提示更新pkgs,但是更新也會產(chǎn)生
    發(fā)表于 09-11 08:28

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1442次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理</b>模型發(fā)布

    請問是否可以將 Nu-Link2-Me V1.0 的固件升級到 V2.0?

    可與 Crossworks for ARM IDE 配合使用。 以下是我在比較兩塊板以找出它不起作用的原因時發(fā)現(xiàn)的差異。NuMaker-M433 連接了 Nu-Link2-Me V2.0
    發(fā)表于 08-18 08:09

    登頂!華為OceanStor A系列存儲再登MLPerf全球性能之巔

    2025年8月5日,全球權威AI性能評測組織公布最新MLPerf? Storage v2.0基準測試結果,華為OceanStor A系列存儲聯(lián)合濟南超級計算技術研究院(簡稱“JNIST”)斬獲佳績
    的頭像 發(fā)表于 08-07 14:02 ?622次閱讀

    智嵌云V2.0獲軟件著作權登記,賦能行業(yè)數(shù)字化升級

    深圳智嵌物聯(lián)網(wǎng)電子技術有限公司,自主研發(fā)的智嵌云V2.0,成功斬獲國家版權局頒發(fā)的軟件著作權登記證書。這一成果不僅是該公司在技術創(chuàng)新與知識產(chǎn)權保護領域的重大突破,更為相關行業(yè)的數(shù)字化轉型注入了強勁動能,同時也標志著 “智嵌云” 從 V1.0 到
    的頭像 發(fā)表于 06-27 15:32 ?455次閱讀
    智嵌云<b class='flag-5'>V2.0</b>獲軟件著作權登記,賦能行業(yè)數(shù)字化升級

    使用MicroPython部署中的ocrrec_image.py推理得到的輸出結果很差,如何解決呢?

    使用在線平臺訓練OCR識別任務,測試結果表現(xiàn)很好。 期待結果和實際結果 實際的推理結果很差,
    發(fā)表于 04-29 06:54

    1.9倍性能提升!英特爾至強6在MLPerf基準測試中表現(xiàn)卓越

    與第五代至強處理器相比,英特爾至強6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準測試結果,其中,英特爾??至強??6性能核處理器在
    的頭像 發(fā)表于 04-07 10:58 ?533次閱讀

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?1250次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理優(yōu)化
    的頭像 發(fā)表于 03-20 15:03 ?1091次閱讀

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?1391次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺提高AI<b class='flag-5'>推理</b>性能