chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

每塊GPU對應(yīng)16TB SSD,英偉達(dá)KV緩存虹吸高性能TLC SSD

晶芯觀察 ? 來源:未知 ? 作者:黃晶晶 ? 2026-02-10 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:黃晶晶

不久前,英偉達(dá)宣布其Vera Rubin平臺(tái)將采用搭載BlueField-4芯片的ICMS架構(gòu),通過卸載KV Cache突破內(nèi)存瓶頸、提升AI推理性能。該架構(gòu)單臺(tái)服務(wù)器每個(gè)GPU需額外配置16TB TLC SSD,花旗預(yù)計(jì)2026年、2027年將分別帶來占全球NAND需求總量2.8%、9.3%的新增需求。

三星電子在 2025Q4 財(cái)報(bào)電話會(huì)議上透露,除了計(jì)劃在本季度啟動(dòng) HBM4 內(nèi)存量產(chǎn)交付之外,三星存儲(chǔ)器業(yè)務(wù)計(jì)劃全方面積極應(yīng)對AI相關(guān)需求,重點(diǎn)提升面向 AI KV(鍵值)存儲(chǔ)需求的高性能 TLC SSD的銷售。

KV緩存對SSD存儲(chǔ)的需求

花旗最新報(bào)告指出,大規(guī)模AI推理面臨顯著的內(nèi)存瓶頸。Transformer模型的核心內(nèi)存優(yōu)化機(jī)制——KV Cache,通過存儲(chǔ)已計(jì)算的鍵值對來避免重復(fù)運(yùn)算,并根據(jù)性能與容量需求分層存儲(chǔ):活躍KV緩存存放于GPU HBM(G1),過渡/溢出KV緩存置于系統(tǒng)DRAM(G2),熱KV緩存則分配至本地SSD(G3)。

為針對性優(yōu)化這一架構(gòu),英偉達(dá)推出了推理上下文內(nèi)存存儲(chǔ)(ICMS)方案。該方案并非替代現(xiàn)有存儲(chǔ)層級(jí),而是在本地SSD(G3)與企業(yè)共享存儲(chǔ)(G4)之間新增一個(gè)G3.5層級(jí)的專用KV Cache。這一層級(jí)能夠高效地將G4中的冷KV上下文數(shù)據(jù)轉(zhuǎn)換為G2中的暖KV緩存,并與HBM協(xié)同工作,從而顯著提升數(shù)據(jù)傳輸效率與整體AI推理性能。

在硬件實(shí)現(xiàn)上,Vera Rubin平臺(tái)采用16TB TLC SSD作為ICMS存儲(chǔ)介質(zhì),結(jié)合KV緩存管理器與拓?fù)涓兄{(diào)度機(jī)制,目標(biāo)實(shí)現(xiàn)三大性能突破:每秒處理令牌數(shù)最高提升5倍、能效比最高提升5倍以及更低的延遲。具體配置方面,每臺(tái)服務(wù)器搭載72塊GPU,每塊GPU對應(yīng)16TB ICMS專用NAND容量,使得單臺(tái)服務(wù)器的總NAND需求達(dá)到1152TB。

與傳統(tǒng)訓(xùn)練場景不同,推理過程依賴于大量的上下文數(shù)據(jù)存儲(chǔ)與快速調(diào)用能力。這一技術(shù)路徑的轉(zhuǎn)變,為NAND閃存開辟了全新的應(yīng)用場景,有望成為繼數(shù)據(jù)中心智能手機(jī)之后的重要需求增長點(diǎn)。

包括閃迪、美光、三星等存儲(chǔ)廠商都瞄準(zhǔn)了KV緩存所需SSD這一增量市場。

閃迪

面對推理場景下高并發(fā)、低延遲的嚴(yán)苛IO需求通用存儲(chǔ)方案往往力不從心。SANDISK DC SN861NVMe SSD正是針對此類計(jì)算密集型工作負(fù)載進(jìn)行的專項(xiàng)優(yōu)化。SN861容量高達(dá)16TB,其基礎(chǔ)是PCle Gen5接口,提供了翻倍的理論帶寬。

SanDisk DC SN861 NVMe SSD,憑借其卓越的性能和可靠性,獲得NVIDIA GB200 NVL72系統(tǒng)認(rèn)證,為AI模型的訓(xùn)練和推理提供強(qiáng)有力的支持。

美光科技

美光 9550 NVMe固態(tài)硬盤專為處理對速度、擴(kuò)展性和能效有極高要求的關(guān)鍵工作負(fù)載而設(shè)計(jì),例如人工智能(AI)、高性能數(shù)據(jù)庫、緩存、在線事務(wù)處理(OLTP)以及高頻交易等場景。美光 9550 固態(tài)硬盤能夠支持上述及更多類型的工作負(fù)載,可靈活部署于云、數(shù)據(jù)中心、原始設(shè)備制造商(OEM)及系統(tǒng)集成商的設(shè)計(jì)方案中。其可用存儲(chǔ)容量最高可達(dá) 30.72TB,有助于確保實(shí)現(xiàn)最優(yōu)的存儲(chǔ)密度。

9550 PCIe 5.0 E1.S 形態(tài)數(shù)據(jù)中心固態(tài)硬盤已納入英偉達(dá)針對 GB200 NVL72 系統(tǒng)及衍生型號(hào)的推薦供應(yīng)商名錄(RVL)。GB200 NVL72 系統(tǒng)搭載英偉達(dá) GB200 格蕾絲?布萊克韋爾超級(jí)芯片,打造出機(jī)架級(jí)、高能效的 AI 基礎(chǔ)設(shè)施。該系統(tǒng)對 PCIe 5.0 存儲(chǔ)的兼容適配,讓美光 9550 固態(tài)硬盤成為優(yōu)化 AI 工作負(fù)載性能與功耗效率的理想選擇,可支撐大規(guī)模 AI 模型訓(xùn)練、萬億參數(shù)大模型實(shí)時(shí)推理,以及高性能計(jì)算(HPC)等核心場景。

三星電子

如前所述,三星電子在 2025Q4 財(cái)報(bào)電話會(huì)議上透露,計(jì)劃重點(diǎn)提升面向 AI KV(鍵值)存儲(chǔ)需求的高性能 TLC SSD的銷售。

韓媒消息稱,三星電子已正式重啟其平澤P4工廠的NAND閃存生產(chǎn)線投資,開始搬入生產(chǎn)設(shè)備。此前,該投資因市場低迷而推遲。作為2026年大規(guī)模投資計(jì)劃的一部分,三星計(jì)劃追加約10萬億韓元資本支出,重點(diǎn)提升DRAM、NAND閃存及晶圓代工產(chǎn)能。平澤基地?cái)U(kuò)產(chǎn)后,預(yù)計(jì)每月將增加NAND芯片產(chǎn)能6萬片,DRAM產(chǎn)能3萬片,晶圓代工產(chǎn)能2萬片。

綠算技術(shù)

近日,本土高性能存儲(chǔ)廠商綠算技術(shù)(ForinnBase)宣布,其旗艦產(chǎn)品GP7000系列全閃存儲(chǔ)平臺(tái)已通過英偉達(dá)適配,成為全球首批、也是唯一支持G3級(jí)KV Cache分層存儲(chǔ)的國產(chǎn)化解決方案,為下一代AI工廠建設(shè)提供了關(guān)鍵的基礎(chǔ)設(shè)施支撐。

綠算技術(shù)GP7000系列采用以太網(wǎng)閃存簇(EBOF)設(shè)計(jì),單系統(tǒng)配備24個(gè)PCIe 5.0 NVMe U.2盤位,通過雙主控板實(shí)現(xiàn)冗余。其核心指標(biāo)精準(zhǔn)匹配G3層需求。

單機(jī)提供6480萬IOPS、288GB/s帶寬與20μs級(jí)延遲,性能較傳統(tǒng)存儲(chǔ)服務(wù)器提升17倍。整機(jī)功耗<900W,每GB/s帶寬功耗僅3.1W,滿足AI工廠的5倍能效目標(biāo)。原生支持BlueField-3/4 DPU與Spectrum-X交換機(jī),通過NVMe-oF/RoCEv2/GDS協(xié)議實(shí)現(xiàn)GPU直連。

綠算技術(shù)產(chǎn)品總監(jiān)孔維海透露:“GP7000采用DPU+ASIC+FPGA多元異構(gòu)計(jì)算架構(gòu),將KV Cache的索引管理、數(shù)據(jù)壓縮和網(wǎng)絡(luò)協(xié)議棧完全硬件卸載,消除了CPU瓶頸?!逼浞植际終V Cache管理器可與英偉達(dá)Dynamo開源項(xiàng)目無縫銜接,實(shí)現(xiàn)跨機(jī)架的緩存一致性。

GP7000已完成廣泛生態(tài)適配。硬件上支持英偉達(dá)DGX H100/H200/GB300、AMD Instinct MI300、華為昇騰910B/C、沐曦曦云C系列等。軟件適配英偉達(dá)Dynamo/vLLM/TensorRT-LLM、華為UCM、Kubernetes CSI等。國產(chǎn)數(shù)據(jù)庫支持OceanBase、TiDB、GaussDB等。

在大模型推理場景中,GP7000可通過命名空間隔離與智能冷熱分層技術(shù),為每個(gè)推理實(shí)例分配獨(dú)立的KV Cache分區(qū),并將高頻數(shù)據(jù)預(yù)加載至G2層,實(shí)現(xiàn)成本與效率的最優(yōu)平衡。

GP7000已于2025年Q3量產(chǎn),并獲得了某頭部云廠商數(shù)千節(jié)點(diǎn)訂單。公司正在研發(fā)基于PCIe 6.0的下一代GP8000,目標(biāo)是將G3級(jí)帶寬提升至1TB/s。

市場前景

花旗通過場景分析測算后認(rèn)為,ICMS架構(gòu)的規(guī)模化落地將為全球NAND市場帶來顯著且確定的需求增量。報(bào)告預(yù)計(jì),2026年Vera Rubin服務(wù)器出貨量將達(dá)到3萬臺(tái),對應(yīng)ICMS架構(gòu)的NAND需求將達(dá)3460萬TB,這一需求規(guī)模占當(dāng)年全球NAND 總需求的2.8%;隨著AI 推理需求的進(jìn)一步釋放,2027年Vera Rubin 服務(wù)器出貨量有望增至10萬臺(tái),屆時(shí)ICMS帶來的 NAN需求將飆升至1152萬TB,占全球NAND總需求的比例將提升至9.3%。

報(bào)告同時(shí)指出,當(dāng)前全球NAND市場本就處于供應(yīng)緊張的狀態(tài),近年來AI產(chǎn)業(yè)的爆發(fā)式發(fā)展已推動(dòng)數(shù)據(jù)存儲(chǔ)需求持續(xù)攀升,NAND作為核心存儲(chǔ)介質(zhì)的供需平衡已較為脆弱。而英偉達(dá) ICMS架構(gòu)帶來的新增需求具有剛性強(qiáng)、規(guī)模大的特點(diǎn),將直接打破現(xiàn)有供需格局,導(dǎo)致全球NAND供應(yīng)短缺的局面進(jìn)一步加劇。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    工業(yè)級(jí)SATA 2.5” ArmourDrive? PX系列SSD深度解析

    高性能存儲(chǔ)產(chǎn)品。下面我們就來詳細(xì)了解一下這款SSD。 文件下載: GLS89SQ1T923-I-CD401.pdf 產(chǎn)品概述 GLS89SQ系列SSD將240GB、480GB、960GB、1.92
    的頭像 發(fā)表于 03-30 14:20 ?123次閱讀

    DRAM緩存真有那么重要嗎?天碩工業(yè)級(jí)SSD固態(tài)硬盤實(shí)測告訴你答案!

    在國產(chǎn)固態(tài)硬盤推薦榜中,推薦五花八門,很多用戶疑惑DRAM 緩存 SSD 值得買嗎?不同方案的國產(chǎn) SSD 性能對比差距到底有多大?價(jià)格差距不小,
    的頭像 發(fā)表于 01-19 16:49 ?403次閱讀

    高性能16位低功耗模數(shù)轉(zhuǎn)換器:TLC4545

    ? 在電子設(shè)計(jì)領(lǐng)域,模數(shù)轉(zhuǎn)換器(ADC)是連接模擬世界和數(shù)字世界的關(guān)鍵橋梁。今天,我們要深入探討德州儀器(TI)的兩款高性能16位低功耗模數(shù)轉(zhuǎn)換器——TLC4541和TLC4545,它
    的頭像 發(fā)表于 12-07 09:31 ?2316次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>16</b>位低功耗模數(shù)轉(zhuǎn)換器:<b class='flag-5'>TLC</b>4545

    PCIe 5.0 8TB SSD挺進(jìn)消費(fèi)級(jí)市場

    電子發(fā)燒友網(wǎng)綜合報(bào)道,隨著AI應(yīng)用的廣泛落地,用戶對存儲(chǔ)速率和容量的需求與日俱增。近期高端消費(fèi)級(jí)SSD市場不斷出現(xiàn)PCIe 5.0?8TB SSD產(chǎn)品。 ? 三星于2025年推出PCIe 5.0旗艦
    的頭像 發(fā)表于 11-22 08:05 ?5161次閱讀

    SSD為何需要DRAM緩存?天碩工業(yè)級(jí)SSD帶來深度解析!

    在當(dāng)今數(shù)字化轉(zhuǎn)型的浪潮中,工業(yè)存儲(chǔ)設(shè)備的選擇直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和效率。天碩工業(yè)級(jí)SSD固態(tài)硬盤憑借其卓越的DRAM緩存技術(shù),在眾多應(yīng)用場景中展現(xiàn)出獨(dú)特優(yōu)勢。本文將采用問答形式,深入探討這一關(guān)
    的頭像 發(fā)表于 10-20 17:59 ?1024次閱讀
    <b class='flag-5'>SSD</b>為何需要DRAM<b class='flag-5'>緩存</b>?天碩工業(yè)級(jí)<b class='flag-5'>SSD</b>帶來深度解析!

    華納云為游戲數(shù)據(jù)庫選擇高性能NVMe SSD存儲(chǔ)

    游戲數(shù)據(jù)庫對速度、可靠性和可擴(kuò)展性有極高要求。隨著在線游戲的發(fā)展,開發(fā)者越來越依賴NVMe SSD存儲(chǔ)來提供服務(wù)器租用和服務(wù)器托管解決方案。本文將指導(dǎo)您了解為游戲數(shù)據(jù)庫選擇高性能NVMe SSD存儲(chǔ)
    的頭像 發(fā)表于 09-30 16:03 ?1183次閱讀

    為什么推薦 SSD 而不是 HDD 的電腦?

    。? 機(jī)械硬盤(HDD):依靠旋轉(zhuǎn)的磁盤和移動(dòng)的磁頭讀寫數(shù)據(jù),類似“小型CD播放機(jī)”。盤片轉(zhuǎn)速和磁頭移動(dòng)速度直接限制性能,且怕震動(dòng)、噪音明顯。 ? 這種原理差異是“SSD全面優(yōu)于HDD”的核心:機(jī)械結(jié)構(gòu)的物理限制,讓HDD在速度、穩(wěn)定性等方面難以突破;而
    的頭像 發(fā)表于 09-25 16:19 ?1757次閱讀
    為什么推薦 <b class='flag-5'>SSD</b> 而不是 HDD 的電腦?

    英偉達(dá)自研HBM基礎(chǔ)裸片

    "后的下一代AI GPU "Feynman"。 ? 有分析指出,英偉達(dá)此舉或是將部分GPU功能集成到基礎(chǔ)裸片中,旨在提高HBM和GPU的整體
    的頭像 發(fā)表于 08-21 08:16 ?2998次閱讀

    沒有掉電保護(hù)的SSD為什么不適合工業(yè)級(jí)場景?

    在電力、工業(yè)自動(dòng)化、軌道交通等領(lǐng)域,數(shù)據(jù)安全容不得半點(diǎn)馬虎。然而很多人并不知道,普通SSD在突發(fā)斷電時(shí)面臨著巨大的風(fēng)險(xiǎn):DRAM緩存中的數(shù)據(jù)可能還未寫入NAND閃存,就因掉電而徹底丟失。那么,沒有
    的頭像 發(fā)表于 07-16 10:54 ?744次閱讀
    沒有掉電保護(hù)的<b class='flag-5'>SSD</b>為什么不適合工業(yè)級(jí)場景?

    工業(yè)級(jí)SSD為什么需要掉電保護(hù)?天碩工業(yè)級(jí)SSD固態(tài)硬盤告訴你答案

    問題專門設(shè)計(jì)了硬件級(jí)PLP(Power Loss Protection)掉電保護(hù)技術(shù)。 PLP掉電保護(hù)通過在SSD內(nèi)部加入鉭電容陣列,在主機(jī)斷電瞬間提供短時(shí)間電力,保證數(shù)據(jù)從緩存區(qū)及時(shí)寫入閃存,避免數(shù)據(jù)丟失。與普通消費(fèi)級(jí)SSD
    的頭像 發(fā)表于 07-09 17:05 ?963次閱讀

    SSD電源管理系統(tǒng)設(shè)計(jì)解決方案

    高性能計(jì)算的發(fā)展,也推動(dòng)著存儲(chǔ)技術(shù)的演進(jìn),這些年固態(tài)硬盤(SSD)市場的火熱,就是一個(gè)例證。
    的頭像 發(fā)表于 07-07 14:16 ?2144次閱讀
    <b class='flag-5'>SSD</b>電源管理系統(tǒng)設(shè)計(jì)解決方案

    企業(yè)級(jí)SSD的核心技術(shù)與市場趨勢

    。 ? 企業(yè)級(jí)SSD的核心部件示意圖 ? 主控芯片(控制大腦) 控制數(shù)據(jù)讀寫,直接決定SSD性能、可靠性固件(操作系統(tǒng)) 確保SSD高效穩(wěn)定運(yùn)行 NAND Flash、DRAM(存
    的頭像 發(fā)表于 07-06 05:34 ?7454次閱讀
    企業(yè)級(jí)<b class='flag-5'>SSD</b>的核心技術(shù)與市場趨勢

    高性能緩存設(shè)計(jì):如何解決緩存偽共享問題

    緩存行,引發(fā)無效化風(fēng)暴,使看似無關(guān)的變量操作拖慢整體效率。本文從緩存結(jié)構(gòu)原理出發(fā),通過實(shí)驗(yàn)代碼復(fù)現(xiàn)偽共享問題(耗時(shí)從3709ms優(yōu)化至473ms),解析其底層機(jī)制;同時(shí)深入剖析高性能緩存
    的頭像 發(fā)表于 07-01 15:01 ?869次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>緩存</b>設(shè)計(jì):如何解決<b class='flag-5'>緩存</b>偽共享問題

    QLC SSD在數(shù)據(jù)中心的用途

    QLC技術(shù)通過在HDD和TLC SSD之間形成中間層來解決這些挑戰(zhàn)。與現(xiàn)有的TLC SSD相比,QLC具有更高的密度、更高的功率效率和更低的成本。
    的頭像 發(fā)表于 05-14 09:02 ?1394次閱讀
    QLC <b class='flag-5'>SSD</b>在數(shù)據(jù)中心的用途

    GPU 維修干貨 | 英偉達(dá) GPU H100 常見故障有哪些?

    上漲,英偉達(dá)H100GPU憑借其強(qiáng)大的算力,成為AI訓(xùn)練、高性能計(jì)算領(lǐng)域的核心硬件。然而,隨著使用場景的復(fù)雜化,H100服務(wù)器故障率也逐漸攀升,輕則影響業(yè)務(wù)進(jìn)度,重
    的頭像 發(fā)表于 05-05 09:03 ?3323次閱讀
    <b class='flag-5'>GPU</b> 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b> <b class='flag-5'>GPU</b> H100 常見故障有哪些?