chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Spectrum以太網(wǎng)平臺的自適應(yīng)路由技術(shù)

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2022-07-10 09:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 加速 AI 平臺和產(chǎn)品(如 NVIDIA EGX 、 DGX 、 OVX 和 NVIDIA AI for Enterprise)需要數(shù)據(jù)中心網(wǎng)絡(luò)提供最佳的性能。NVIDIA Spectrum 以太網(wǎng)平臺通過芯片級創(chuàng)新實現(xiàn)了這一性能。

融合以太網(wǎng) RDMA(RoCE)自適應(yīng)路由技術(shù)通過減少網(wǎng)絡(luò)擁塞問題加快了應(yīng)用程序的速度。這篇文章介紹了 NVIDIA Spectrum 以太網(wǎng)平臺的自適應(yīng)路由技術(shù),并提供了一些初步的性能基準(zhǔn)。

是什么讓網(wǎng)絡(luò)變慢了?

您不必是云服務(wù)提供商就可以從橫向擴展網(wǎng)絡(luò)中獲益。網(wǎng)絡(luò)行業(yè)已經(jīng)發(fā)現(xiàn),具有第 2 層轉(zhuǎn)發(fā)和生成樹的傳統(tǒng)網(wǎng)絡(luò)架構(gòu)效率低下,而且難以擴展。他們過渡到 IP 網(wǎng)絡(luò)結(jié)構(gòu)。

這是一個很好的開始,但在某些情況下,它可能不足以解決數(shù)據(jù)中心中引入的新型應(yīng)用程序和大量的流量。

可擴展 IP 網(wǎng)絡(luò)的一個關(guān)鍵屬性是它們能夠跨多個交換機層次結(jié)構(gòu)分發(fā)大量的流和流量。

在一個完美的世界中,數(shù)據(jù)流是完全不相關(guān)的,因此在多個網(wǎng)絡(luò)鏈路上分布均勻、負(fù)載平衡平穩(wěn)。該方法依賴于現(xiàn)代哈希和多路徑算法,包括等價多路徑(ECMP)。運營商受益于在規(guī)模迥異的數(shù)據(jù)中心中廣泛部署的高端口數(shù)、固定規(guī)格的交換機。

然而,在許多情況下,這是行不通的,通常包括無處不在的現(xiàn)代工作負(fù)載,如 AI 、云和存儲。

這是一個有限熵的問題。熵是一種衡量流經(jīng)給定網(wǎng)絡(luò)的流量的豐富性和多樣性的方法。

當(dāng)您有數(shù)千個從全球各地的客戶端隨機連接的流時,您的網(wǎng)絡(luò)被稱為有 high entropy 。然而,當(dāng)您只有少數(shù)大型流時(這在 AI 和存儲工作負(fù)載中經(jīng)常發(fā)生),大型流會控制帶寬,因此會出現(xiàn) low entropy 。這種低熵流量模式也稱為“大象流”分布,在許多數(shù)據(jù)中心工作負(fù)載中都很明顯。

那么為什么熵很重要呢?

使用靜態(tài) ECMP 的傳統(tǒng)技術(shù),您需要高熵來將流量均勻地分布在多個鏈路上,而不會出現(xiàn)擁塞。然而,在“大象流”場景中,多個流可能出現(xiàn)在同一條鏈路上,從而創(chuàng)建一個超過線路帶寬的流量熱點或微突發(fā)。這會導(dǎo)致?lián)砣?、延遲增加、數(shù)據(jù)包丟失和重傳。

對于許多應(yīng)用程序,性能不僅取決于網(wǎng)絡(luò)的平均帶寬,還取決于流完成時間的分布。完成時間分布中的長尾或異常值可能會顯著降低應(yīng)用程序性能。圖 2 顯示了低熵對流完成時間的影響。

此示例由單個架頂交換機組成,具有 128 個 100G 端口。

64 個端口是連接到服務(wù)器的 100G 下游端口。

64 個端口是連接到第 1 層交換機的 100G 上游端口。

每個下游端口接收四個帶寬相等的流:25G 每個流,總共 256 個流。

所有流量都通過靜態(tài)哈希和 ECMP 處理。

在最好的情況下,此配置的可用帶寬不會被超額使用,因此可能會出現(xiàn)以下結(jié)果。在最壞的情況下,與理想情況相比,流程可能需要長達 2.5 倍的時間才能完成。

在這種情況下,一些端口擁塞,而其他端口未使用。最后一個流(最壞情況流)的預(yù)期持續(xù)時間是預(yù)期第一個流持續(xù)時間的 250% 。此外,10% 的流預(yù)計流完成時間超過 150% 。也就是說,有一組長尾流,完成時間比預(yù)期的要長。為了高置信度的避免擁塞(98%),必須將所有流的帶寬降低到 50% 以下。

為什么有許多流會而受到影響而完成時間過長?這是因為 ECMP 上的一些端口非常擁擠。當(dāng)流完成傳輸并釋放一些端口帶寬時,滯后流通過相同的擁塞端口,導(dǎo)致更多擁塞。這是因為在對標(biāo)頭進行哈希處理后,路由是靜態(tài)的。

自適應(yīng)路由

NVIDIA 正在為Spectrum交換機引入自適應(yīng)路由。通過自適應(yīng)路由,轉(zhuǎn)發(fā)到 ECMP 組的流量選擇擁塞程度最低的端口進行傳輸。擁塞程度基于出口隊列負(fù)載進行評估,確保 ECMP 組在不考慮熵級別的情況下保持良好平衡。向多個服務(wù)器發(fā)出多個請求的應(yīng)用程序以最小的時間變化接收數(shù)據(jù)。

這是如何實現(xiàn)的?對于轉(zhuǎn)發(fā)到 ECMP 組的每個數(shù)據(jù)包,交換機在其出口隊列上選擇負(fù)載最小的端口。評估的隊列是那些與數(shù)據(jù)包服務(wù)質(zhì)量匹配的隊列。

相比之下,傳統(tǒng)的 ECMP 基于哈希方法進行端口決策,這通常無法產(chǎn)生清晰的比較。當(dāng)相同流的不同數(shù)據(jù)包通過網(wǎng)絡(luò)的不同路徑傳輸時,它們可能會在到達目的地時出現(xiàn)亂序的情況。在 RoCE 傳輸層,NVIDIA ConnectX NIC 負(fù)責(zé)處理無序數(shù)據(jù)包,并將數(shù)據(jù)按順序轉(zhuǎn)發(fā)給應(yīng)用程序。這使得自適應(yīng)路由對從中受益的應(yīng)用程序透明。

在發(fā)送方面,ConnectX 可以動態(tài)標(biāo)記符合網(wǎng)絡(luò)重新排序的條件的流量,從而確保在需要時可以強制執(zhí)行消息間排序。交換機自適應(yīng)路由分類器只能對這些標(biāo)記的 RoCE 流量進行分類,使其使用這種獨特的轉(zhuǎn)發(fā)方式。

Spectrum 自適應(yīng)路由技術(shù)支持各種網(wǎng)絡(luò)拓?fù)?。對?CLOS(或葉/脊椎)等典型拓?fù)?,到給定目標(biāo)的各種路徑的距離是相同的。因此,交換機通過擁塞最小的端口傳輸數(shù)據(jù)包。在路徑之間距離不同的其他拓?fù)渲?,交換機傾向于通過最短路徑發(fā)送流量。如果擁塞發(fā)生在最短路徑上,則選擇擁塞最小的備選路徑。這確保了網(wǎng)絡(luò)帶寬得到有效利用。

工作負(fù)載測試結(jié)果

存儲

為了驗證 RoCE 中自適應(yīng)路由的效果,我們從測試簡單的 RDMA 寫測試應(yīng)用程序開始。在這些在多個 50 Gb/s 主機上運行的測試中,我們將主機分成幾對,每對主機在很長一段時間內(nèi)互相發(fā)送大型 RDMA 寫流。這種類型的流量模式是存儲應(yīng)用程序工作負(fù)載中的典型模式。

圖 4 顯示了基于哈希的靜態(tài)路由在上行鏈路端口上發(fā)生沖突,導(dǎo)致流完成時間增加,帶寬減少,流之間的公平性降低。在轉(zhuǎn)移到自適應(yīng)路由后,所有問題都得到了解決。

在第一個圖中,所有流幾乎同時完成,峰值帶寬相當(dāng)。

在第二個圖中,一些流實現(xiàn)了相同的帶寬和完成時間,而其他流發(fā)生沖突,導(dǎo)致完成時間更長,帶寬更低。實際上,在 ECMP 的情況下,一些流在 13 秒的理想完成時間 T 內(nèi)完成,而性能最差的流需要 31 秒,約為 T 的 2.5 倍。

人工智能/高性能計算

為了繼續(xù)評估 RoCE 工作負(fù)載中的自適應(yīng)路由,我們在一個 32 服務(wù)器測試臺上測試了常見 AI 基準(zhǔn)測試的性能收益,該測試臺在兩級胖樹網(wǎng)絡(luò)拓?fù)渲惺褂盟膫€ NVIDIA Spectrum 以太網(wǎng)交換機構(gòu)建。該基準(zhǔn)測試評估了分布式 AI 訓(xùn)練和 HPC 工作負(fù)載中常見的集合操作和網(wǎng)絡(luò)流量模型,如 all-to-all 流量和 all-reduce 操作。

總結(jié)

在許多情況下,基于靜態(tài)哈希的轉(zhuǎn)發(fā)會導(dǎo)致高擁塞和可變的流完成時間。這會降低應(yīng)用程序的性能。

NVIDIA Spectrum 自適應(yīng)路由解決了這個問題。這項技術(shù)增加了網(wǎng)絡(luò)使用的帶寬,最大限度地減少了流完成時間的變化,從而提高了應(yīng)用程序的性能。

將此技術(shù)與 NVIDIA ConnectX 網(wǎng)卡提供的 RoCE 亂序包支持相結(jié)合,應(yīng)用程序?qū)λ褂玫募夹g(shù)是透明的。這確保了 NVIDIA Spectrum 以太網(wǎng)平臺提供了實現(xiàn)數(shù)據(jù)中心性能最大化所需的加速以太網(wǎng)能力。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    41

    文章

    6154

    瀏覽量

    181501
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5682

    瀏覽量

    110090
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    8326

    瀏覽量

    95540
  • 路由技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    6637
  • spectrum
    +關(guān)注

    關(guān)注

    0

    文章

    47

    瀏覽量

    14987

原文標(biāo)題:部署 NVIDIA Spectrum Ethernet 的自適應(yīng)路由功能加速網(wǎng)絡(luò)通信

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    車載以太網(wǎng),速度直指Tbps?

    由于成本原因在某些領(lǐng)域保留CAN或LIN,而且集成各種以太網(wǎng)標(biāo)準(zhǔn)在技術(shù)上是可行的,但很復(fù)雜。汽車以太網(wǎng)的應(yīng)用仍然面臨諸多挑戰(zhàn),包括噪聲、測試和互操作性
    的頭像 發(fā)表于 04-02 11:00 ?2121次閱讀
    車載<b class='flag-5'>以太網(wǎng)</b>,速度直指Tbps?

    NVIDIA Spectrum-X以太網(wǎng)硅光技術(shù)助力AI工廠網(wǎng)絡(luò)創(chuàng)新

    NVIDIA 將率先為 AI 工廠引入采用光電一體封裝 (CPO) 的優(yōu)化以太網(wǎng)網(wǎng)絡(luò),通過 NVIDIA Spectrum-X 以太網(wǎng)硅光
    的頭像 發(fā)表于 01-14 09:06 ?854次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum</b>-X<b class='flag-5'>以太網(wǎng)</b>硅光<b class='flag-5'>技術(shù)</b>助力AI工廠網(wǎng)絡(luò)創(chuàng)新

    NVIDIA擴大與微軟合作推動AI超級工廠建設(shè)

    在 Microsoft Ignite 大會上,NVIDIA 擴大與微軟的合作,包括在由 NVIDIA Blackwell 平臺驅(qū)動的全新 Microsoft Fairwater AI 超級工廠中部署新一代
    的頭像 發(fā)表于 12-01 09:52 ?954次閱讀

    NVIDIA Spectrum-X 以太網(wǎng)交換機助力 Meta 和 Oracle 加速網(wǎng)絡(luò)性能

    Facebook 開放交換系統(tǒng)平臺。 Oracle 采用 Spectrum-X 以太網(wǎng)交換機構(gòu)建十億瓦級(Giga-Scale)AI 超級計算機。 NVIDIA 宣布 Meta 和
    的頭像 發(fā)表于 10-14 10:26 ?2045次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum</b>-X <b class='flag-5'>以太網(wǎng)</b>交換機助力 Meta 和 Oracle 加速網(wǎng)絡(luò)性能

    電磁干擾自適應(yīng)抑制系統(tǒng)平臺全面解析

    電磁干擾自適應(yīng)抑制系統(tǒng)平臺全面解析
    的頭像 發(fā)表于 09-17 16:12 ?821次閱讀
    電磁干擾<b class='flag-5'>自適應(yīng)</b>抑制系統(tǒng)<b class='flag-5'>平臺</b>全面解析

    NVIDIA推出Spectrum-XGS以太網(wǎng)技術(shù)

    NVIDIA 今日宣布推出 NVIDIA Spectrum-XGS 以太網(wǎng)。這項跨區(qū)域擴展(scale-across)技術(shù)可將多個分布式數(shù)據(jù)
    的頭像 發(fā)表于 08-27 12:51 ?1460次閱讀

    以太網(wǎng)模塊被忽視的角落 #電磁兼容EMC #電子工程師 #電子元器件 #磁珠 #濾波電容 #以太網(wǎng)

    以太網(wǎng)
    深圳市韜略科技有限公司
    發(fā)布于 :2025年07月25日 17:35:35

    WiFi和以太網(wǎng)哪個更快

    以太網(wǎng)通常比WiFi更快、更穩(wěn)定,尤其在理想條件下差距顯著;而WiFi勝在靈活便捷,但實際速度受環(huán)境干擾較大。 以下是具體分析: 一、理論速度對比 以太網(wǎng) 千兆以太網(wǎng)(1Gbps) :理論速度達
    的頭像 發(fā)表于 07-01 09:54 ?2658次閱讀

    以太網(wǎng)入門:從零開始,掌握以太網(wǎng)基礎(chǔ)知識!

    以太網(wǎng)作為現(xiàn)代通信技術(shù)的基石,其重要性不言而喻。無論是日常網(wǎng)絡(luò)應(yīng)用,還是AI對高速大帶寬網(wǎng)絡(luò)的需求,以太網(wǎng)都扮演著不可或缺的角色。本文將從零開始,帶您了解以太網(wǎng)的基礎(chǔ)知識,幫助您快速入
    的頭像 發(fā)表于 06-09 14:00 ?4117次閱讀
    <b class='flag-5'>以太網(wǎng)</b>入門:從零開始,掌握<b class='flag-5'>以太網(wǎng)</b>基礎(chǔ)知識!

    Microchip LAN9211-ABZJ 集成 10/100 以太網(wǎng) PHY的以太網(wǎng)控制器

    Microchip LAN9211-ABZJ 集成 10/100 以太網(wǎng) PHY的以太網(wǎng)控制器
    的頭像 發(fā)表于 06-04 14:56 ?1273次閱讀
    Microchip LAN9211-ABZJ 集成 10/100 <b class='flag-5'>以太網(wǎng)</b> PHY的<b class='flag-5'>以太網(wǎng)</b>控制器

    雙通道CAN轉(zhuǎn)以太網(wǎng)#CAN轉(zhuǎn)以太網(wǎng)#三格電子

    以太網(wǎng)
    三格電子科技
    發(fā)布于 :2025年05月12日 13:17:05

    矽昌通信推出千兆以太網(wǎng)PHY芯片

    1.總體描述1.1.概述SF23P1240是一款低功耗,帶有QSGMI!接口的四通道以太網(wǎng)多口PHY,可以廣泛應(yīng)用于以太網(wǎng)交換機、路由器、企業(yè)網(wǎng)關(guān)等各類產(chǎn)品中。1.2.功能特性MAC接口為
    的頭像 發(fā)表于 05-09 15:33 ?1651次閱讀
    矽昌通信推出千兆<b class='flag-5'>以太網(wǎng)</b>PHY芯片

    Modbus轉(zhuǎn)以太網(wǎng)終極方案:三步實現(xiàn)老舊設(shè)備智能升級

    包率低 典型痛點場景: ? 污水處理廠30個泵站Modbus儀表數(shù)據(jù)無法集中監(jiān)控 ? 紡織車間200臺老設(shè)備需投入6人專職抄表 ? 能源集團因協(xié)議不兼容損失百萬級數(shù)據(jù) 二、Modbus轉(zhuǎn)以太網(wǎng)核心技術(shù)
    發(fā)表于 04-24 10:37