chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負載的推理平臺

NVIDIA英偉達企業(yè)解決方案 ? 來源:未知 ? 2023-03-23 06:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌云、D-ID、Cohere 將新平臺用于各種生成式 AI 服務(wù),包括聊天機器人、文本生成圖像內(nèi)容、AI 視頻等

加利福尼亞州圣克拉拉 - GTC - 太平洋時間 2023 年 3 月 21 日 – NVIDIA 于今日推出四款推理平臺。這些平臺針對各種快速興起的生成式 AI 應(yīng)用進行了優(yōu)化,能夠幫助開發(fā)人員快速構(gòu)建用于提供新服務(wù)和洞察的 AI 驅(qū)動的專業(yè)應(yīng)用。

這些平臺將 NVIDIA 的全棧推理軟件與最新的 NVIDIA Ada、Hopper 和 Grace Hopper 處理器相結(jié)合,包括今天推出的 NVIDIA L4 Tensor Core GPU 和 NVIDIA H100 NVL GPU。各平臺針對 AI 視頻、圖像生成、大型語言模型部署、推薦系統(tǒng)推理等需求激增的工作負載進行了優(yōu)化。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“生成式 AI 的興起需要更加強大的推理計算平臺。生成式 AI 應(yīng)用的數(shù)量是無限的,它唯一的限制就是人類的想象力。為開發(fā)人員提供最強大、靈活的推理計算平臺將加快新服務(wù)的創(chuàng)造速度,這些新服務(wù)將以前所未有的方式改善我們的生活?!?/p>

加速生成式 AI 的各種推理工作負載集

每個平臺都包含一個為特定生成式 AI 推理工作負載而優(yōu)化的 NVIDIA GPU 和專用的軟件:

  • 適用于 AI 視頻的 NVIDIA L4 可提供比 CPU 高出 120 倍的 AI 視頻性能,同時能效提高了 99%。這款適用于幾乎所有工作負載的通用 GPU 提供更加強大的視頻解碼和轉(zhuǎn)碼能力、視頻流式傳輸、增強現(xiàn)實、生成式 AI 視頻等。

  • 適用于圖像生成的 NVIDIA L40 針對圖形以及 AI 支持的 2D、視頻和 3D 圖像生成進行了優(yōu)化。L40 平臺是 NVIDIA Omniverse(一個用于在數(shù)據(jù)中心構(gòu)建和運行元宇宙應(yīng)用的平臺)的引擎,與上一代產(chǎn)品相比,其 Stable Diffusion 推理性能提高了 7 倍,Omniverse 性能提高了 12 倍。

  • 適用于大型語言模型部署的 NVIDIA H100 NVL 是規(guī)?;渴鹣?ChatGPT 這樣的大型語言模型(LLMs)的理想平臺。這款新的 H100 NVL 擁有 94GB 內(nèi)存和 Transformer 引擎加速,在數(shù)據(jù)中心規(guī)模,與上一代 A100 相比,GPT-3 上的推理性能提高了多達 12 倍。

  • 適用于推薦模型的 NVIDIA Grace Hopper 是圖形推薦模型、矢量數(shù)據(jù)庫和圖神經(jīng)網(wǎng)絡(luò)的理想平臺。通過 NVLink-C2C 以 900 GB/s 的速度連接 CPU 和 GPU,Grace Hopper 的數(shù)據(jù)傳輸和查詢速度比 PCIe 5.0 快了 7 倍。

這些平臺的軟件層采用 NVIDIA AI Enterprise 軟件套件,包括用于高性能深度學(xué)習(xí)推理的軟件開發(fā)套件 NVIDIA TensorRT,以及幫助實現(xiàn)模型部署標準化的開源推理服務(wù)軟件 NVIDIA Triton Inference Server。

早期采用者與支持

谷歌云是 NVIDIA 推理平臺的重要云合作伙伴和早期客戶。該公司正在將 L4 平臺整合到其機器學(xué)習(xí)平臺 Vertex AI 中,并且是第一家提供 L4 實例的云服務(wù)提供商,其 G2 虛擬機的私人預(yù)覽版已于今天推出。

NVIDIA 和谷歌今天分別宣布了首批在谷歌云上使用 L4 的兩家機構(gòu)——Descript 和 WOMBO,前者使用生成式 AI 幫助創(chuàng)作者制作視頻和播客,后者提供 “Dream” 這一 AI 驅(qū)動的文本-數(shù)字藝術(shù)轉(zhuǎn)換應(yīng)用程序。

另一個早期采用者快手提供了一個短視頻應(yīng)用程序,利用 GPU 對傳入的實時流媒體視頻進行解碼、捕捉關(guān)鍵幀并優(yōu)化音視頻。然后,它使用一個基于 Transformer 的大型模型理解多模態(tài)內(nèi)容,從而提高全球數(shù)億用戶的點擊率。

快手高級副總裁于越表示:“快手推薦系統(tǒng)所服務(wù)的社區(qū)每天的用戶人數(shù)超過 3.6 億,他們每天貢獻 3000 萬條 UGC 視頻。在相同的總體擁有成本下,相較于 CPU,NVIDIA GPU 將系統(tǒng)的端到端吞吐量提高了 11 倍,將延遲降低了 20%?!?/p>

領(lǐng)先的生成式 AI 技術(shù)平臺 D-ID,通過使用 NVIDIA L40 GPU 從文本中生成逼真的數(shù)字人,支持任何內(nèi)容來生成人臉,不僅幫助專業(yè)人士改進視頻內(nèi)容,同時減少了大規(guī)模視頻制作的成本和麻煩。

D-ID 研發(fā)副總裁 Or Gorodissky 表示:“L40 的性能十分驚人。有了它,我們將推理速度提高了一倍。D-ID 十分高興能夠?qū)⑦@個新硬件作為我們產(chǎn)品的一部分,以前所未有的性能和分辨率實現(xiàn) AI 人的實時流傳輸,并降低我們的計算成本?!?/p>

領(lǐng)先的 AI 制作工作室 Seyhan Lee 使用生成式 AI 為電影、廣播和娛樂行業(yè)開發(fā)沉浸式體驗和迷人的創(chuàng)意內(nèi)容。

Seyhan Lee 聯(lián)合創(chuàng)始人 Pinar Demirdag 表示:“L40 GPU 為我們的生成式 AI 應(yīng)用帶來了驚人的性能提升。憑借 L40 的推理能力和內(nèi)存容量,我們可以部署非常先進的模型,并以驚人的速度和精度向客戶提供創(chuàng)新的服務(wù)?!?/p>

語言 AI 領(lǐng)域的先鋒 Cohere 所運行的平臺使得開發(fā)人員能夠在保護數(shù)據(jù)隱私和安全的情況下,構(gòu)建自然語言模型。

Cohere 首席執(zhí)行官 Aidan Gomez 表示:“憑借 NVIDIA 的全新高性能 H100 推理平臺,我們可以使用先進的生成式模型為客戶提供更加優(yōu)質(zhì)、高效的服務(wù),推動對話式 AI、多語言企業(yè)搜索、信息提取等各種 NLP 應(yīng)用的發(fā)展。”

供應(yīng)情況

NVIDIA L4 GPU 私人預(yù)覽版現(xiàn)已通過谷歌云平臺以及 30 多家計算機制造商所組成的全球網(wǎng)絡(luò)提供。

NVIDIA L40 GPU 現(xiàn)已通過全球領(lǐng)先的系統(tǒng)提供商提供,并且合作伙伴平臺的數(shù)量將在今年持續(xù)增加。

Grace Hopper 超級芯片已開始樣品供貨,預(yù)計下半年將全面投產(chǎn)。H100 NVL GPU 也將于下半年面市。

NVIDIA AI Enterprise 現(xiàn)在通過各大云市場以及數(shù)十家系統(tǒng)提供商和合作伙伴提供。NVIDIA AI Enterprise 為客戶提供 NVIDIA 企業(yè)級支持、定期安全審查以及 NVIDIA Triton Inference Server、TensorRT 和 50 多個預(yù)訓(xùn)練模型與框架的 API 穩(wěn)定性。

NVIDIA LaunchPad 上免費提供的動手實驗室可以試用用于生成式 AI 的 NVIDIA 推理平臺。樣品實驗室的內(nèi)容包括訓(xùn)練和部署一個客服聊天機器人、部署一個端到端 AI 工作負載、在 H100 上調(diào)整和部署一個語言模型以及使用 NVIDIA Triton 部署一個欺詐檢測模型。

掃描海報二維碼,或點擊“閱讀原文”,即可觀看 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛 GTC23 主題演講重播!

ef9782d0-c903-11ed-bfe3-dac502259ad0.gif ?

百里挑一!

3 月 23 日不可錯過的演講!

GTC23 | 黃仁勛與 Ilya Sutskever 的爐邊談話重磅來襲!— 看 AI 的現(xiàn)狀和未來


原文標題:GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負載的推理平臺

文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4112

    瀏覽量

    99588

原文標題:GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負載的推理平臺

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA GTC 2026展示推動物理AI時代的虛擬世界

    NVIDIA GTC 大會標志著物理 AI 迎來了一個重要轉(zhuǎn)折點:機器人、車輛和工廠正從單一的用例與孤立的部署,擴展為跨行業(yè)的復(fù)雜企業(yè)級工作負載
    的頭像 發(fā)表于 04-03 10:07 ?480次閱讀

    是德科技推出全新AI推理仿真平臺

    是德科技(NYSE: KEYS)近日推出KAI推理構(gòu)建器(Keysight AI Inference Builder),這款仿真與分析平臺旨在大規(guī)模驗證針對
    的頭像 發(fā)表于 03-20 17:27 ?796次閱讀
    是德科技<b class='flag-5'>推出</b>全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b>仿真<b class='flag-5'>平臺</b>

    NVIDIA Jetson模型賦能AI在邊緣端落地

    開源生成 AI 模型不再局限于數(shù)據(jù)中心,而是開始深入到現(xiàn)實世界的各種機器中。從 Orin 到 Thor,NVIDIA Jetson 系列正
    的頭像 發(fā)表于 03-16 16:27 ?569次閱讀
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b>賦能<b class='flag-5'>AI</b>在邊緣端落地

    NVIDIA推出代理式AI藍圖與電信推理模型

    借助全新開源大型電信模型NVIDIA Blueprint,電信運營商能夠利用自有數(shù)據(jù)訓(xùn)練 AI 智能體,構(gòu)建自主網(wǎng)絡(luò)。
    的頭像 發(fā)表于 03-06 17:37 ?3028次閱讀

    LLM推理模型是如何推理的?

    過程與核心見解拆解。一、核心論點與總覽LRM(如o1,R1)的“推理”能力提升,并非源于模型學(xué)會了人類的邏輯推理,而是通過兩類主要技術(shù)手段,優(yōu)化了
    的頭像 發(fā)表于 01-19 15:33 ?666次閱讀
    LLM<b class='flag-5'>推理模型</b>是如何<b class='flag-5'>推理</b>的?

    NVIDIA 推出 Alpamayo 系列開源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車開發(fā)

    新聞?wù)?: l NVIDIA 率先發(fā)布為應(yīng)對輔助駕駛長尾場景挑戰(zhàn)而設(shè)計的開源視覺-語言-動作推理模型(Reasoning VLA);NVIDIA Alpamayo 系列還包含賦能輔助
    的頭像 發(fā)表于 01-06 09:40 ?499次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>推出</b> Alpamayo 系列開源 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>與工具,加速安全可靠的<b class='flag-5'>推理</b>型輔助駕駛汽車開發(fā)

    NVIDIA推動面向數(shù)字與物理AI的開源模型發(fā)展

    NVIDIA 發(fā)布一系列涵蓋語音、安全與輔助駕駛領(lǐng)域的全新 AI 工具,其中包括面向移動出行領(lǐng)域的行業(yè)級開源視覺-語言-動作推理模型(Reasoning VLA)
    的頭像 發(fā)表于 12-13 09:50 ?1506次閱讀

    通過NVIDIA Jetson AGX Thor實現(xiàn)7倍生成AI性能

    Jetson Thor 平臺還支持多種主流量化格式,包括 NVIDIA Blackwell GPU 架構(gòu)的新 NVFP4 格式,有助于進一步優(yōu)化推理性能。該平臺同時支持推測解碼等新技術(shù)
    的頭像 發(fā)表于 10-29 16:53 ?1606次閱讀

    什么是AI模型推理能力

    NVIDIA 的數(shù)據(jù)工廠團隊為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ),該模型近日在 Hugging Face
    的頭像 發(fā)表于 09-23 15:19 ?1432次閱讀

    研華科技推出基于NVIDIA Jetson Thor平臺的邊緣AI新品MIC-743

    研華重磅推出基于NVIDIA Jetson Thor平臺的邊緣AI新品 MIC-743,這款突破性產(chǎn)品以高達2070 FP4 TOPS的AI
    的頭像 發(fā)表于 08-29 14:53 ?2265次閱讀

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1988次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理模型</b>發(fā)布

    利用NVIDIA推理模型構(gòu)建AI智能體

    開放推理模型能夠更快、更廣泛地進行思考,為客戶服務(wù)、網(wǎng)絡(luò)安全、制造、物流和機器人等領(lǐng)域的 AI 智能體生成更明智的結(jié)果。
    的頭像 發(fā)表于 08-13 14:32 ?1736次閱讀
    利用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理模型</b>構(gòu)建<b class='flag-5'>AI</b>智能體

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新一代AI模型。其核心優(yōu)勢在于強大的
    發(fā)表于 07-16 15:29

    谷歌新一代生成AI媒體模型登陸Vertex AI平臺

    我們在 Vertex AI推出新一代生成 AI 媒體模型: Imagen 4、Veo 3
    的頭像 發(fā)表于 06-18 09:56 ?1277次閱讀

    使用NVIDIA Earth-2生成AI基礎(chǔ)模型革新氣候建模

    NVIDIA 正通過 cBottle(Climate in a Bottle 的簡稱)為這項工作帶來新的突破,這是全球首個專為以公里尺度分辨率模擬全球氣候而設(shè)計的生成
    的頭像 發(fā)表于 06-12 15:54 ?1445次閱讀