NVIDIA Vera CPU 為大規(guī)模數(shù)據(jù)處理、AI 訓練和智能體式推理提供最高性能與能效
新聞摘要:
NVIDIA Vera CPU 較傳統(tǒng) CPU 在效率上提升 2 倍,速度提升 50%。
與 NVIDIA 合作部署 Vera CPU 的客戶包括阿里巴巴、字節(jié)跳動、Meta、Oracle Cloud Infrastructure、CoreWeave、Lambda、Nebius 和 Nscale。
已采用 Vera CPU 的制造商合作伙伴包括戴爾科技、HPE、聯(lián)想和 Supermicro,以及華碩、Compal、Foxconn、技嘉、Pegatron、Quanta Cloud Technology (QCT)、Wistron 和 Wiwynn。
加利福尼亞州圣何塞 — GTC — 太平洋時間 2026 年 3 月 16 日— NVIDIA 今日發(fā)布 NVIDIA Vera CPU,這是全球首款專為代理式 AI 與強化學習時代打造的處理器,其效率是傳統(tǒng)機架級 CPU 的 2 倍,速度提升 50%。
隨著推理和代理式 AI 的發(fā)展,規(guī)模、性能和成本越來越取決于支撐模型的基礎設施,這些模型負責規(guī)劃任務、運行工具、與數(shù)據(jù)交互、運行代碼并驗證結果。
NVIDIA Vera CPU基于NVIDIA Grace? CPU的成功經(jīng)驗打造而成,助力各行業(yè)、各種規(guī)模的組織都能構建 AI 工廠,大規(guī)模釋放代理式 AI 的潛力。憑借卓越的單線程性能和每核心帶寬,Vera 重新定義了 CPU。它能提供更高的 AI 吞吐量、響應速度和效率,從而支持大規(guī)模 AI 服務,例如編程助手以及面向消費者和企業(yè)的智能體應用。
與 NVIDIA 合作部署 Vera 的頭部超大規(guī)模企業(yè)包括阿里巴巴、CoreWeave、Meta 和 Oracle Cloud Infrastructur,以及戴爾科技、HPE、聯(lián)想和 Supermicro 等全球系統(tǒng)制造商。這一廣泛采用使 Vera 成為面向開發(fā)者、初創(chuàng)公司、公共和私營機構及企業(yè)最重視的 AI 工作負載的新型 CPU 標準,有助于讓更多人平等地使用 AI 并加速創(chuàng)新。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“AI 正邁向一個轉折點,Vera 應勢而來。隨著智能變得具有能動性——能夠推理并采取行動——重心就轉移到了編排這些工作的系統(tǒng)。CPU 不再只是支持模型,而是開始驅(qū)動模型。憑借突破性的性能與能效,Vera 助力 AI 系統(tǒng)實現(xiàn)更快的運算速度和更廣的擴展能力。”
為各類數(shù)據(jù)中心提供靈活配置
NVIDIA 發(fā)布了全新的 Vera CPU 機架,集成了 256 個液冷 Vera CPU,能夠持續(xù)支持超過 22,500 個并發(fā)的 CPU 環(huán)境,每個環(huán)境均可以全性能獨立運行。AI 工廠可在單個機架內(nèi)快速部署并擴展至數(shù)萬個并發(fā)實例和智能體工具。
全新的 Vera 機架采用NVIDIA MGX?模塊化參考架構,并獲得了全球 80 家生態(tài)合作伙伴的支持。
作為NVIDIA Vera Rubin NVL72平臺的一部分,Vera CPU 還可通過 NVIDIA NVLink?-C2C 互連技術與 NVIDIA GPU 配對,提供高達 1.8 TB / s 的相干帶寬,是 PCIe Gen 6 帶寬的 7 倍,從而實現(xiàn) CPU 與 GPU 之間的高速數(shù)據(jù)共享。此外,NVIDIA 還推出了新的參考設計:將 Vera 用作 NVIDIA HGX? Rubin NVL8 系統(tǒng)的主機 CPU,負責協(xié)調(diào) GPU 加速工作負載的數(shù)據(jù)搬運和系統(tǒng)控制。
Vera 系統(tǒng)的合作伙伴正推出支持雙路和單路 CPU 服務器配置,非常適合強化學習、智能體式推理、數(shù)據(jù)處理、系統(tǒng)編排、存儲管理、云應用以及高性能計算等場景。
在所有配置中,Vera 系統(tǒng)均與NVIDIA ConnectX?SuperNIC 網(wǎng)卡和NVIDIA BlueField?-4DPU 集成,以實現(xiàn)加速網(wǎng)絡、存儲和安全性能,這些對代理式 AI 至關重要。這使客戶能夠針對其特定工作負載進行優(yōu)化,同時在整個 NVIDIA 平臺上保持統(tǒng)一的軟件堆棧。
專為智能體擴展而設計
通過結合高性能、高能效的 CPU 核心、高帶寬內(nèi)存子系統(tǒng)以及第二代 NVIDIA 可擴展一致性互連架構 (NVIDIA Scalable Coherency Fabric),Vera 能夠在代理式 AI 與強化學習常見的極端利用率環(huán)境下,實現(xiàn)更快速的智能體響應。
Vera 搭載 88 個由 NVIDIA 專門設計的 Olympus 核心,可為涉及編譯器、運行時引擎、分析流水線、智能體工具和編排服務的工作負載提供高性能支持。每個核心可通過 NVIDIA Spatial Multithreading 技術同時運行兩個任務,以提供一致且可預測的性能,非常適合需要同時處理多項作業(yè)的多租戶 AI 工廠。
為進一步提升能效,Vera 引入了 NVIDIA 第二代低功耗內(nèi)存子系統(tǒng),采用 LPDDR5X 內(nèi)存,可提供高達 1.2 TB / s 的帶寬。與通用 CPU 相比,其帶寬提升了 2 倍,而功耗僅為其一半。
廣泛的生態(tài)系統(tǒng)支持
AI 原生軟件開發(fā)領域的創(chuàng)新企業(yè) Cursor 正采用 NVIDIA Vera,以提升其 AI 編程智能體的性能。
Cursor 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Michael Truell 表示:“我們很高興能使用 NVIDIA Vera CPU 來提升整體吞吐量和效率,從而為我們的客戶提供更快速、響應更靈敏的編程智能體體驗?!?/p>
領先的流數(shù)據(jù)與 AI 平臺 Redpanda 正在采用 Vera,以顯著提升系統(tǒng)性能。
Redpanda 創(chuàng)始人兼首席執(zhí)行官 Alex Gallego 表示:“Redpanda 最近測試了運行 Apache Kafka 兼容工作負載的 NVIDIA Vera,發(fā)現(xiàn)其性能遠超我們此前測試過的其他系統(tǒng),延遲最高可降低至原來約 18%。Vera 代表了 CPU 架構發(fā)展的新方向,每顆核心擁有更大內(nèi)存和更低單核成本,使我們的客戶能夠?qū)崟r流媒體工作負載擴展到前所未有的規(guī)模,并解鎖全新的 AI 與智能體應用?!?/p>
計劃部署 Vera CPU 的國家級實驗室包括 Leibniz Supercomputing Centre、Los Alamos National Laboratory、National Energy Research Scientific Computing Center (隸屬于 Lawrence Berkeley National Laboratory) 和 Texas Advanced Computing Center (TACC)。
TACC 高性能計算總監(jiān) John Cazes 表示:“在 TACC,我們最近測試了 NVIDIA Vera CPU 平臺,準備在即將推出的 Horizon 系統(tǒng)中進行部署。在運行六個科學應用時,早期結果令人矚目。Vera 在單核性能和內(nèi)存帶寬方面的表現(xiàn),代表著科學計算邁出了一大步。我們期待在今年晚些時候,為 Horizon 的 CPU 用戶提供基于 Vera 的節(jié)點?!?/p>
計劃部署 Vera CPU 的領先云服務提供商包括阿里巴巴、字節(jié)跳動、Cloudflare、CoreWeave、Crusoe、Lambda、Nebius、Nscale、Oracle Cloud Infrastructure、Together.AI 和 Vultr。
采用 Vera CPU 的領先基礎設施提供商包括Aivres、ASRock Rack、華碩、Compal、思科、戴爾、Foxconn、技嘉、HPE、Hyve、Inventec、聯(lián)想、MiTAC、MSI、Pegatron、Quanta Cloud Technology (QCT)、Supermicro、Wistron 和 Wiwynn。
發(fā)售時間
NVIDIA Vera 已進入全面量產(chǎn)階段,并將于今年下半年通過合作伙伴正式發(fā)售。
-
處理器
+關注
關注
68文章
20323瀏覽量
254604 -
cpu
+關注
關注
68文章
11320瀏覽量
225793 -
NVIDIA
+關注
關注
14文章
5682瀏覽量
110086
原文標題:GTC2026 | NVIDIA 推出 Vera CPU,專為代理式 AI 打造
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
NVIDIA發(fā)布Vera Rubin DSX AI Factory參考設計
Linux系統(tǒng)性能優(yōu)化與調(diào)試的思路?
高壓高速低邊驅(qū)動器SiLM27531MAC-AQ,以30V耐壓與5A強驅(qū)提升系統(tǒng)性能
NVIDIA推出NVQLink高速互連架構
RK3399:性能與能效的嵌入式先鋒,解鎖多場景應用潛力
Linux系統(tǒng)性能優(yōu)化技巧
Linux系統(tǒng)性能調(diào)優(yōu)方案
MT6816以高分辨率角度反饋賦能無刷電機FOC系統(tǒng)能效躍升
佐航BYQ3712PK變壓器能效等級測試儀:以精準測量賦能配電變壓器能效升級
傾佳電子:SiC碳化硅功率器件革新混合逆變儲能系統(tǒng),引領能效革命
Blue Lion超級計算機將在NVIDIA Vera Rubin上運行
優(yōu)化電機控制以提高能效
交流充電樁負載能效提升技術
正點原子Linux最小系統(tǒng)板RK3506B資料發(fā)布!超低功耗,滿載功耗低發(fā)熱小,實現(xiàn)性能與能效雙突破!
能效比和算力提升的衡量方法
NVIDIA推出Vera CPU以顯著提升系統(tǒng)性能與能效
評論