chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NIM微服務(wù)登陸亞馬遜云科技

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-12-06 13:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

經(jīng)過優(yōu)化的 NIM 微服務(wù)現(xiàn)可在 Amazon Bedrock Marketplace、SageMaker JumpStart 和 AWS Marketplace 上獲取,用于各種 NVIDIA 和生態(tài)系統(tǒng)模型。

生成式 AI 正在迅速改變各行各業(yè),同時(shí)推動(dòng)了對(duì)安全、高性能推理解決方案的需求,以便高效且經(jīng)濟(jì)地?cái)U(kuò)展日益復(fù)雜的模型。

在本屆亞馬遜云科技 re:Invent 大會(huì)上,亞馬遜云科技(AWS)宣布其正在擴(kuò)大與 NVIDIA 的合作范圍,現(xiàn)已將 NVIDIA NIM 微服務(wù)擴(kuò)展到各項(xiàng)關(guān)鍵的亞馬遜云科技 AI 服務(wù)中,從而幫助生成式 AI 應(yīng)用提高 AI 推理速度并降低延遲。

NVIDIA NIM微服務(wù)現(xiàn)在可直接通過 AWS Marketplace、Amazon Bedrock Marketplace 以及 Amazon SageMaker JumpStart 獲取,讓開發(fā)者能夠更加輕松地為常用模型大規(guī)模部署經(jīng)過 NVIDIA 優(yōu)化的推理。

NVIDIA NIM 是NVIDIA AI Enterprise軟件平臺(tái)的一部分,可在 AWS Marketplace 獲取。它為開發(fā)者提供的一套易于使用的微服務(wù),專為在各種云、數(shù)據(jù)中心和工作站安全、可靠地部署高性能、企業(yè)級(jí) AI 模型推理而設(shè)計(jì)。

這些預(yù)構(gòu)建的容器基于強(qiáng)大的推理引擎(例如NVIDIA Triton 推理服務(wù)器、NVIDIA TensorRT、NVIDIA TensorRT-LLM和 PyTorch)構(gòu)建而成,支持從開源社區(qū)模型到NVIDIA AI Foundation模型與定制模型等各種 AI 模型。

NIM 微服務(wù)可部署到各種亞馬遜云科技服務(wù)中,包括 Amazon Elastic Compute Cloud(EC2)、Amazon Elastic Kubernetes Service(EKS)和 Amazon SageMaker。

開發(fā)者可以在 NVIDIA API 目錄中預(yù)覽常用模型和系列模型構(gòu)建的 100 多項(xiàng) NIM 微服務(wù),包括 Meta 的 Llama 3、Mistral AI 的 Mistral 和 Mixtral、NVIDIA Nemotron、Stability AI 的 SDXL 等等。其中最常用的微服務(wù)可以自托管的形式部署于亞馬遜云科技服務(wù)中,并且針對(duì)在亞馬遜云科技中的 NVIDIA 加速計(jì)算實(shí)例運(yùn)行進(jìn)行了優(yōu)化。

目前可直接從亞馬遜云科技獲取的 NIM 微服務(wù)包括:

NVIDIA Nemotron-4:可在 Amazon Bedrock Marketplace、Amazon SageMaker Jumpstart 和 AWS Marketplace 中獲取。這是一款先進(jìn)的 LLM ,其專為生成與現(xiàn)實(shí)世界數(shù)據(jù)高度相似的各種合成數(shù)據(jù)而設(shè)計(jì),從而提高各領(lǐng)域定制 LLM 的性能和穩(wěn)健性。

Llama 3.1 8B-Instruct:可在 AWS Marketplace 中獲取。這個(gè) 80 億參數(shù)的多語種大語言模型經(jīng)過預(yù)訓(xùn)練和指令調(diào)整,適用于語言理解、推理和文本生成用例。

Llama 3.1 70B-Instruct:可在 AWS Marketplace 中獲取。這個(gè)經(jīng)過指令調(diào)整的 700 億參數(shù)預(yù)訓(xùn)練模型針對(duì)多語種對(duì)話進(jìn)行了優(yōu)化。

Mixtral 8x7B Instruct v0.1:可在 AWS Marketplace 中獲取。這個(gè)具有開放權(quán)重的高質(zhì)量稀疏混合專家模型可以遵循指令、完成請(qǐng)求并生成創(chuàng)意文本格式。

亞馬遜云科技上的 NIM 適用于所有人

各行各業(yè)的客戶和合作伙伴都在通過亞馬遜云科技上的 NIM 來更快地進(jìn)入市場(chǎng)、維護(hù)其生成式 AI 應(yīng)用和數(shù)據(jù)的安全性與可控性,并降低成本。

IT 咨詢和數(shù)字服務(wù)提供商 SoftServe 開發(fā)了 6 款生成式 AI 解決方案,完全部署在亞馬遜云科技上,并通過 NVIDIA NIM 和亞馬遜云科技服務(wù)加速。這 6 款解決方案在 AWS Marketplace 中提供,分別為 SoftServe Gen AI Drug Discovery、SoftServe Gen AI Industrial Assistant、Digital Concierge、Multimodal RAG System、Content Creator 和 Speech Recognition Platform。

這些解決方案均基于NVIDIA AI Blueprint。NVIDIA AI Blueprint 是加速 AI 應(yīng)用開發(fā)和部署的綜合參考工作流,并具有 NVIDIA 加速程序庫、軟件開發(fā)套件和 NIM 微服務(wù),適用于 AI 智能體、數(shù)字孿生等。

即刻使用亞馬遜云科技上的 NIM

開發(fā)者可以根據(jù)自己的需求和要求在亞馬遜云科技上部署 NVIDIA NIM 微服務(wù)。這樣一來,開發(fā)者和企業(yè)就可以在各種亞馬遜云科技服務(wù)中使用經(jīng)過 NVIDIA 優(yōu)化的推理容器,以實(shí)現(xiàn)高性能 AI。

訪問 NVIDIA API 目錄,查看 100 多種經(jīng)過 NIM 優(yōu)化的模型,并申請(qǐng)開發(fā)者許可證或 NVIDIA AI Enterprise 90 天試用許可證,就可以開始在亞馬遜云科技服務(wù)上部署 NVIDIA 微服務(wù)。開發(fā)者還可以在 AWS Marketplace、Amazon Bedrock Marketplace 或 Amazon SageMaker JumpStart 中探索 NIM 微服務(wù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5581

    瀏覽量

    109618
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39503

    瀏覽量

    301029
  • NIM
    NIM
    +關(guān)注

    關(guān)注

    0

    文章

    10

    瀏覽量

    8250
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2729

    瀏覽量

    85702
  • 微服務(wù)
    +關(guān)注

    關(guān)注

    0

    文章

    148

    瀏覽量

    8092

原文標(biāo)題:亞馬遜云科技上的 NVIDIA NIM 大幅增強(qiáng) AI 推理能力

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    小鵬汽車正式宣布登陸新西蘭市場(chǎng)

    今日,小鵬汽車正式宣布登陸新西蘭市場(chǎng),首批多家服務(wù)中心已于2026年1月投入運(yùn)營(yíng),這標(biāo)志著小鵬汽車在新西蘭市場(chǎng)布局已全面啟動(dòng),體現(xiàn)了品牌持續(xù)拓展全球版圖、推動(dòng)智能出行愿景落地的堅(jiān)定承諾。
    的頭像 發(fā)表于 02-09 15:42 ?363次閱讀

    小鵬汽車成功登陸卡塔爾市場(chǎng)

    小鵬汽車在中東非市場(chǎng)的本地化布局近期迎來密集升級(jí):成功登陸卡塔爾市場(chǎng),與毛里求斯合作伙伴達(dá)成戰(zhàn)略合作,并于阿聯(lián)酋阿布扎比及埃及新開羅同步啟用全新展廳與服務(wù)中心。
    的頭像 發(fā)表于 12-30 17:40 ?1079次閱讀

    曦智科技光計(jì)算模擬器LTSimulator正式登陸移動(dòng)平臺(tái)

    全球領(lǐng)先的光電混合算力提供商曦智科技近日宣布,其核心軟件工具——光計(jì)算模擬器LTSimulator正式登陸移動(dòng)平臺(tái)。此舉旨在為廣大開發(fā)者與研究人員提供更便捷、高效的云端光計(jì)算研發(fā)環(huán)境,標(biāo)志著曦智科技聯(lián)合中國(guó)移動(dòng)蘇州研發(fā)中心在推動(dòng)光計(jì)算生態(tài)共建與協(xié)同創(chuàng)新方面邁出重要一步。
    的頭像 發(fā)表于 11-21 09:49 ?489次閱讀

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服務(wù)為 A
    的頭像 發(fā)表于 11-03 14:48 ?917次閱讀

    華納VPS容器服務(wù)網(wǎng)格流量管理:實(shí)現(xiàn)微服務(wù)高效路由

    計(jì)算和微服務(wù)架構(gòu)日益普及的今天,華納香港VPS憑借其優(yōu)越的地緣優(yōu)勢(shì)和網(wǎng)絡(luò)自由,成為眾多企業(yè)部署容器化應(yīng)用的熱門選擇。復(fù)雜的微服務(wù)架構(gòu)帶來了流量管理的巨大挑戰(zhàn)。本文將深入探討如何利
    的頭像 發(fā)表于 10-16 17:09 ?520次閱讀

    NVIDIA Dynamo新增對(duì)亞馬遜科技服務(wù)的支持

    亞馬遜科技 (AWS) 開發(fā)者和解決方案架構(gòu)師現(xiàn)在可以在基于 NVIDIA GPU 的 Amazon EC2 上使用 NVIDIA Dynamo,包括由
    的頭像 發(fā)表于 07-28 14:31 ?957次閱讀
    <b class='flag-5'>NVIDIA</b> Dynamo新增對(duì)<b class='flag-5'>亞馬遜</b><b class='flag-5'>云</b>科技<b class='flag-5'>服務(wù)</b>的支持

    電商API的微服務(wù)架構(gòu)優(yōu)化策略

    ? 隨著電子商務(wù)的快速發(fā)展,API(應(yīng)用程序編程接口)已成為電商平臺(tái)的核心組件,負(fù)責(zé)連接用戶、商家和后臺(tái)系統(tǒng)。微服務(wù)架構(gòu)通過將應(yīng)用拆分為獨(dú)立、可擴(kuò)展的服務(wù)單元,顯著提升了系統(tǒng)的靈活性和可維護(hù)性。然而
    的頭像 發(fā)表于 07-23 14:30 ?600次閱讀
    電商API的<b class='flag-5'>微服務(wù)</b>架構(gòu)優(yōu)化策略

    NVIDIA技術(shù)助力企業(yè)創(chuàng)建主權(quán)AI智能體

    AI Factory 的經(jīng)驗(yàn)證設(shè)計(jì)將加速基礎(chǔ)設(shè)施與軟件(包括全新 NVIDIA NIM 微服務(wù)和經(jīng)擴(kuò)展的 NVIDIA Blueprint)相結(jié)合,為各國(guó)和企業(yè)簡(jiǎn)化了全棧式 AI 開發(fā)
    的頭像 發(fā)表于 06-16 14:28 ?1324次閱讀

    2025 NVIDIA創(chuàng)業(yè)企業(yè)展示澳門站圓滿收官

    2025 技術(shù)精華解讀、亞馬遜科技 AI Agent 智能化應(yīng)用分享、圓桌討論和項(xiàng)目路演、大企業(yè)對(duì)接、以及第三屆 NVIDIA DPU 中國(guó)黑客松競(jìng)賽啟動(dòng)等環(huán)節(jié)。本次活動(dòng)由澳門永利渡假村、創(chuàng)賽創(chuàng)新中心聯(lián)合主辦,
    的頭像 發(fā)表于 05-29 14:12 ?919次閱讀

    企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能體平臺(tái)

    已發(fā)布的 NeMo 微服務(wù)可與合作伙伴平臺(tái)集成,作為創(chuàng)建 AI 智能體的構(gòu)建模塊,使用商業(yè)智能與強(qiáng)大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務(wù)。
    的頭像 發(fā)表于 04-27 15:05 ?1266次閱讀

    NVIDIA NIM微服務(wù)現(xiàn)已推出

    生成式 AI 為 PC 和工作站帶來了全新功能,包括游戲助手、增強(qiáng)的內(nèi)容創(chuàng)作和生產(chǎn)力工具等。
    的頭像 發(fā)表于 04-08 16:56 ?923次閱讀

    Altair One? 云端門戶與 NVIDIA Omniverse 實(shí)時(shí)數(shù)字孿生藍(lán)圖完成全面整合

    正式宣布其?Altair One?云端門戶與?NVIDIA Omniverse 實(shí)時(shí)數(shù)字孿生藍(lán)圖實(shí)現(xiàn)技術(shù)融合。通過整合?GPU 加速、NVIDIA NIM 微服務(wù)與?Omniverse
    的頭像 發(fā)表于 04-02 14:01 ?645次閱讀

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Enterprise 軟件平臺(tái)之間的集成,將使 160 多個(gè) AI 工具和 100 多個(gè) NVIDIA NIM 微服務(wù)通過 OCI 控制臺(tái)以原生方式提供。此外,Oracle 和 NVIDIA
    的頭像 發(fā)表于 03-21 12:01 ?1407次閱讀
    英偉達(dá)GTC2025亮點(diǎn):Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)加速代理式AI推理

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    Oracle Cloud Infrastructure (OCI) 與 NVIDIA AI Enterprise 軟件平臺(tái)之間的集成,將使 160 多個(gè) AI 工具和 100 多個(gè) NVIDIA NIM?
    發(fā)表于 03-19 15:24 ?566次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)加速代理式 AI 推理

    亞馬遜科技Marketplace(中國(guó)區(qū))正式支持專業(yè)服務(wù)產(chǎn)品

    北京 ——2025 年 2 月 28 日 亞馬遜科技宣布,由西數(shù)據(jù)運(yùn)營(yíng)的亞馬遜科技Marketplace(中國(guó)區(qū))正式支持專業(yè)
    發(fā)表于 02-28 13:42 ?378次閱讀