chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

蔚來基于NVIDIA Triton搭建的推理服務(wù)平臺

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-10-09 10:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在近日舉行的 GTC 大會上,蔚來 AI 平臺負責(zé)人白宇利帶來非常有價值的分享,他首次對外透露了蔚來自研的全棧式自動駕駛系統(tǒng)(NAD)的部署和開發(fā)情況,同時也將蔚來自動駕駛研發(fā)平臺(NADP)這個神秘的“Peta Factory”帶到了公眾視野中。

據(jù)了解,NADP是服務(wù)于蔚來自動駕駛核心業(yè)務(wù)方向的研發(fā)平臺,用于開發(fā) NAD 功能。以“Peta”為名是因為每輛車每天能生成 55 petabit數(shù)據(jù)(1 petabit = 10^6 gigabit = 10^9 megabit = 10^15 bits),而 NADP 是所有流程、工作流、數(shù)據(jù)以及底層軟硬件的組合。NADP 能夠以一站式平臺管理大量復(fù)雜的 AI 應(yīng)用,并將模型開發(fā)效率提高 20 倍,從而縮短自動駕駛汽車的上市周期,開發(fā)出更新、更快的架構(gòu)。

在模型訓(xùn)練、測試和部署的過程中,為了確保新改進能夠切實地解決相應(yīng)問題,且不會引發(fā)任何新問題, NADP 需要執(zhí)行 10 萬項推理任務(wù),包括數(shù)據(jù)挖掘、仿真和回歸測試。經(jīng)過眾多方案的對比和篩選,蔚來選用了NVIDIA Triton 推理服務(wù)器作為核心組件,構(gòu)建了 NADP 的高性能推理服務(wù)。

正如白宇利在分享中提到:“我們基于 NVIDIA Triton 推理服務(wù)器構(gòu)建了高性能推理服務(wù)。此服務(wù)非常適用于 NADP,并可輕松集成模型倉庫、工作流、Jupyter、Prometheus 和許多其他組件,從而簡化 AI 推理。Triton 讓編排和擴展變得更輕松,還能將推理速度提高至 6 倍,并可節(jié)省 24% 的資源?!?/p>

蔚來基于 NVIDIA Triton 搭建的推理服務(wù)平臺,在數(shù)據(jù)挖掘業(yè)務(wù)場景下,通過服務(wù)器端模型前處理和多模型 DAG 式編排,GPU 資源平均節(jié)省 24%;在部分核心 pipeline 上,吞吐能力提升為原來的 5 倍,整體時延降低為原來的 1/ 6。

Triton 在設(shè)計之初,就融入了云原生的設(shè)計思路,為后面逐步圍繞 Triton 搭建完整的云原生平臺性推理解決方案提供了相當(dāng)大的便利。

作為 NADP 推理平臺的核心組件,Triton 與 NADP 的各個組件形成了一套完整的推理一站式解決方案。從集成效率、高性能、易用性、高可用四方面,在 NADP 推理平臺中提供助力。

目前,NADP 數(shù)據(jù)挖掘業(yè)務(wù)下的相關(guān)模型預(yù)測服務(wù)已經(jīng)全部遷移至 Triton 推理服務(wù)器,為上百個模型提供了高吞吐預(yù)測能力。同時在某些任務(wù)基礎(chǔ)上,通過自實現(xiàn)前處理算子、前后處理服務(wù)化、BLS 串聯(lián)模型等手段,將一些模型任務(wù)合并起來,極大的提升了處理效率。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5682

    瀏覽量

    110091
  • 自動駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14972

    瀏覽量

    181322
  • 蔚來
    +關(guān)注

    關(guān)注

    1

    文章

    597

    瀏覽量

    15265

原文標(biāo)題:成功案例:蔚來 NADP + NVIDIA Triton,搭建穩(wěn)定高效的推理平臺

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    哥斯達黎加首家中心正式開業(yè)

    當(dāng)?shù)貢r間3月26日,公司在哥斯達黎加的首家門店——中心|圣何塞正式開業(yè)。駐哥斯達黎加使館參贊俞善君等嘉賓出席開業(yè)儀式并剪彩。該門店由
    的頭像 發(fā)表于 03-30 14:34 ?192次閱讀

    是德科技推出全新AI推理仿真平臺

    是德科技(NYSE: KEYS)近日推出KAI推理構(gòu)建器(Keysight AI Inference Builder),這款仿真與分析平臺旨在大規(guī)模驗證針對推理進行優(yōu)化的AI基礎(chǔ)設(shè)施。是德科技將在
    的頭像 發(fā)表于 03-20 17:27 ?797次閱讀
    是德科技推出全新AI<b class='flag-5'>推理</b>仿真<b class='flag-5'>平臺</b>

    匈牙利首家國家總代理門店開業(yè)

    當(dāng)?shù)貢r間1月22日,在匈牙利迎來重要里程碑——位于布達佩斯的NIO AutoWallis Showroom正式開業(yè)。這是在匈牙利落地的首家國家總代理門店,標(biāo)志
    的頭像 發(fā)表于 01-27 14:42 ?536次閱讀

    NVIDIA DGX SuperPOD為Rubin平臺橫向擴展提供藍圖

    NVIDIA DGX Rubin 系統(tǒng)整合了 NVIDIA 在計算、網(wǎng)絡(luò)和軟件領(lǐng)域的最新突破,將推理 token 成本降至 NVIDIA Blackwell
    的頭像 發(fā)表于 01-14 09:14 ?803次閱讀

    如何在NVIDIA Jetson AGX Thor上通過Docker高效部署vLLM推理服務(wù)

    繼系統(tǒng)安裝與環(huán)境配置后,本期我們將繼續(xù)帶大家深入 NVIDIA Jetson AGX Thor 的開發(fā)教程之旅,了解如何在 Jetson AGX Thor 上,通過 Docker 高效部署 vLLM 推理服務(wù)
    的頭像 發(fā)表于 11-13 14:08 ?4360次閱讀
    如何在<b class='flag-5'>NVIDIA</b> Jetson AGX Thor上通過Docker高效部署vLLM<b class='flag-5'>推理</b><b class='flag-5'>服務(wù)</b>

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造的推理框架,核心目標(biāo)是突破 NVIDIA 平臺上的
    的頭像 發(fā)表于 10-21 11:04 ?1380次閱讀

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1991次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理</b>模型發(fā)布

    積算科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型算力

    北京2025年7月30日 /美通社/ -- 近日,北京積算科技有限公司(以下簡稱"積算科技")宣布其算力服務(wù)平臺上線赤兔推理引擎。積算科技PowerFul-AI應(yīng)用開發(fā)平臺與赤兔合作,
    的頭像 發(fā)表于 07-30 21:44 ?1026次閱讀

    能源實現(xiàn)海南換電縣縣通

    隨著換電站在海南白沙黎族自治縣、昌江黎族自治縣、保亭黎族苗族自治縣、臨高縣同步上線,能源在海南正式實現(xiàn)換電縣縣通,41座換電站覆蓋除三沙之外的海南島23個區(qū)縣,每個區(qū)縣都有
    的頭像 發(fā)表于 07-29 17:00 ?1227次閱讀

    第1000座高速公路換電站上線運營

    近日,第1,000座高速公路換電站——換電站|G5011蕪合高速福山服務(wù)區(qū)合肥方向正式上線運營,
    的頭像 發(fā)表于 07-14 14:28 ?1075次閱讀

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 開源其物理 AI 平臺 NVIDIA Cosmos 中的關(guān)鍵模型——NVIDIA Cosmos Reason-1-7B。這款先進的多模態(tài)大模型能夠理解視頻、進行物理
    的頭像 發(fā)表于 07-09 10:17 ?991次閱讀

    公司6月交付新車24925臺

    2025年6月,公司交付新車24,925臺,同比增長17.5%。其中,品牌交付新車14,593臺;樂道品牌交付新車6,400臺;firefly螢火蟲品牌交付新車3,932臺。2
    的頭像 發(fā)表于 07-04 18:21 ?1292次閱讀

    使用NVIDIA Triton和TensorRT-LLM部署TTS應(yīng)用的最佳實踐

    針對基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Love
    的頭像 發(fā)表于 06-12 15:37 ?2048次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Triton</b>和TensorRT-LLM部署TTS應(yīng)用的最佳實踐

    能源實現(xiàn)天津換電縣縣通

    近日,隨著 換電站|天津和平安泊城市港灣 上線,能源在天津正式實現(xiàn)換電縣縣通,56座換電站覆蓋全市16個區(qū),每個區(qū)都有
    的頭像 發(fā)表于 06-03 15:28 ?1183次閱讀

    企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能體平臺

    已發(fā)布的 NeMo 微服務(wù)可與合作伙伴平臺集成,作為創(chuàng)建 AI 智能體的構(gòu)建模塊,使用商業(yè)智能與強大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務(wù)。
    的頭像 發(fā)表于 04-27 15:05 ?1461次閱讀