chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為AI推理打造高達24Gb/s的GDDR6 PHY,Rambus全面支持中國市場的AI升級

晶芯觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃晶晶 ? 2023-05-26 16:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能在通過大量的數(shù)據(jù)進行訓(xùn)練之后,神經(jīng)網(wǎng)絡(luò)打造的完整模型將被集成在邊緣或?qū)嶋H應(yīng)用場之中,往往大量的AI正是應(yīng)用在于邊緣AI推理。與AI訓(xùn)練需要大量的數(shù)據(jù)和算力不同,AI推理對算力的需求大幅下降,但對成本和功耗更為敏感。

在AI推理應(yīng)用越來越多的趨勢下,Rambus率先研判與推出GDDR6 IP產(chǎn)品組合。Rambus IP核產(chǎn)品營銷高級總監(jiān)Frank Ferro先生表示,作為更加理想的方案,GDDR6有著高帶寬以及低時延的特性,能夠幫助邊緣端更好地處理數(shù)據(jù)。

Rambus GDDR6 PHY以及控制器的配套產(chǎn)品,已經(jīng)達到了業(yè)界領(lǐng)先的24Gb/s的數(shù)據(jù)傳輸速率,這也是全新的一個行業(yè)標桿,可以為AI推理等應(yīng)用場景帶來巨大性能優(yōu)勢和收益。

除性能之外,另一大優(yōu)勢是對功耗的管理。因為當設(shè)備在高速和高帶寬環(huán)境下運行時,良好的功耗管理非常重要。

還有系統(tǒng)層面的設(shè)計。如果要確保系統(tǒng)在24Gb/s環(huán)境下運行,需要良好的系統(tǒng)級信號完整性。Rambus信號完整性的工程師,也會與客戶進行非常緊密的從設(shè)計初期開始的合作,能夠確??蛻暨\行系統(tǒng)的時候達到最高的性能。

另外,Rambus提供的產(chǎn)品已經(jīng)實現(xiàn)了PHY以及控制器的完整集成。在客戶收到產(chǎn)品之后,可以直接對這些子系統(tǒng)進行定制化應(yīng)用。

GDDR6內(nèi)存接口子系統(tǒng)的結(jié)構(gòu)


下圖的結(jié)構(gòu)包括PHY物理層、控制器、DRAM以及客戶端的ASIC



Frank Ferro解析,PHY的物理層與DRAM進行直接連接,這個接口是由兩個16位的插槽所組成,加起來是32位。

另外一側(cè)是DFI接口與內(nèi)存的控制器進行連接,控制器直接接入到整個系統(tǒng)的邏輯控制。Rambus提供的是中間標藍的兩個非常重要的環(huán)節(jié),也就是完整的子系統(tǒng),Rambus會根據(jù)客戶具體應(yīng)用場景和實際的訴求對子系統(tǒng)來進行優(yōu)化,并將其作為完整的子系統(tǒng)來交付給客戶。

GDDR的“G”代表的是graphic (圖形),因此它可以用于圖形處理,同時也可以用于人工智能以及機器學(xué)習(xí)算法中,以及網(wǎng)絡(luò)應(yīng)用等。

在GDDR6擁有的諸多特點中,值得一提的是clamshell模式,具體指的是每個信道可以支持兩個GDDR6的設(shè)備。換句話說,在clamshell模式之下整個容量是直接翻倍乘以2的。



另外,GDDR6現(xiàn)在已經(jīng)支持比較先進的FinFET工藝節(jié)點,實際上從2019年開始Rambus就已經(jīng)支持非常先進的制程工藝。

同時,也會針對PCB以及封裝提供相關(guān)的參考設(shè)計。在內(nèi)部有專門的信號完整度和邊緣完整性的專家,來幫助客戶去完成整個的設(shè)計工作。

Frank Ferro表示,Rambus的GDDR6接口子系統(tǒng)可以實現(xiàn)高達24Gb/s的卓越性能,可以為每個GDDR6內(nèi)存設(shè)備提供最高達到96Gb/s的帶寬。GDDR6是在AI應(yīng)用場景下比較合理的產(chǎn)品和選擇,因為可以在成本和性能之間達成不錯的平衡。

邊緣AI推理,GDDR6是更合適的選擇


實際上內(nèi)存的形式有很多種,DDR、LPDDR、GDDR以及HBM等,那么邊緣AI推理用哪種內(nèi)存最合適,在Frank Ferro看來GDDR6將是脫穎而出的那一個。

他說,GDDR6有著優(yōu)秀的數(shù)據(jù)傳輸速率,可適用于很多AI推理場景。尤其在一些網(wǎng)絡(luò)應(yīng)用中,GDDR6能具有重要作用?!艾F(xiàn)在非常多的具體網(wǎng)絡(luò)應(yīng)用場景都已經(jīng)開始在邊緣端實現(xiàn)了。尤其是有的應(yīng)用要求所有傳入的數(shù)據(jù)必須在本地進行實時處理,這種需求的增加對本身產(chǎn)品架構(gòu)的要求會很高。因此傳統(tǒng)的DDR方案已經(jīng)遠遠不能滿足要求,因為需要有很多的DDR設(shè)備。而部署GDDR6在邊緣設(shè)備,能夠大幅度降低網(wǎng)絡(luò)邊緣設(shè)備對DDR數(shù)量的需求?!?br />
一般來說,AI推理對帶寬的需求在200到500Gb/s的范圍之間。而每一個GDDR6設(shè)備的帶寬可以達到96Gb/s,通過將4-5個GDDR6設(shè)備組合,就可以輕松滿足500Gb/s及以下的帶寬需求。

以DDR4為例,它的速度可能最高能達到3.2Gb/s。雖然它的成本相對較低,但是速度是一大劣勢。GDDR技術(shù)在幾年前就能夠?qū)崿F(xiàn)16Gb/s的帶寬,已經(jīng)超過DDR技術(shù)的三到四倍之多。當然,DDR、GDDR和LPDDR這些不同的產(chǎn)品都是以標準的DRAM為基礎(chǔ),LPDDR更關(guān)注低功耗管理,DDR本身的數(shù)據(jù)存儲密度會更高一點,而GDDR是更關(guān)注于速度。

此外,如果用到一個HBM3設(shè)備就能夠達到接近800Gb的帶寬,但它會使得成本增加3至4倍。因此,對于對帶寬和低延遲有很高要求的AI訓(xùn)練場景,HBM可能是更好的選擇。而對于需要更大容量、更高帶寬的AI推理場景,則GDDR6是更合適的選擇。

全面的產(chǎn)品組合,滿足中國客戶不同的AI需求

Rambus作為一家業(yè)界領(lǐng)先的半導(dǎo)體IP和芯片供應(yīng)商,技術(shù)實力強勁,擁有3000多項技術(shù)專利,企業(yè)使命是讓數(shù)據(jù)傳輸更快、更安全。經(jīng)過三十多年的發(fā)展和創(chuàng)新,Rambus現(xiàn)在的主要業(yè)務(wù)包含基礎(chǔ)專利授權(quán)、芯片IP授權(quán)和內(nèi)存接口芯片。Rambus的技術(shù)和產(chǎn)品面向的市場是數(shù)據(jù)密集型市場,包括數(shù)據(jù)中心、5G、物聯(lián)網(wǎng)IoT、汽車等細分市場。其產(chǎn)品組合,與AIGC應(yīng)用對數(shù)據(jù)傳輸?shù)男枨笫制鹾稀?br />


以ChatGPT為代表的AIGC應(yīng)用熱潮襲卷到中國,我們可以看到中國不少互聯(lián)網(wǎng)大廠都發(fā)布了自己的AI大模型。那么Rambus如何支持中國客戶的AI數(shù)據(jù)傳輸需求呢?

Rambus大中華區(qū)總經(jīng)理蘇雷先生長期投身中國市場,他表示Rambus在和芯片廠商的溝通中發(fā)現(xiàn)更多廠商聚焦于AI訓(xùn)練,因此他們的方案更多需求在于HBM;在與云廠商的溝通中,他們更多是關(guān)注數(shù)據(jù)中心推出的一系列產(chǎn)品,即中國式ChatGPT產(chǎn)品,他們需要更多的算力。在內(nèi)存產(chǎn)品上,Rambus有非常好的接口芯片,向云廠商提供我們的服務(wù)和產(chǎn)品。



還有一類客戶是中國的OEM和ODM廠商,他們把目光轉(zhuǎn)向了當前非常新的技術(shù)CXL。因為CXL可以帶來更多內(nèi)存帶寬和內(nèi)存容量,所以我們正在緊密合作提供方案,以加大整個系統(tǒng)內(nèi)存的帶寬,幫助他們的產(chǎn)品推向市場。

蘇雷說,Rambus China立足于中國市場,愿意更多、更緊密地支持中國公司在ChatGPT產(chǎn)業(yè)的發(fā)展,以最好的技術(shù)、最快的響應(yīng)和最好的技術(shù)支持來服務(wù)中國市場,給廣大客戶保駕護航。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Rambus
    +關(guān)注

    關(guān)注

    0

    文章

    67

    瀏覽量

    19344
  • PHY
    PHY
    +關(guān)注

    關(guān)注

    2

    文章

    340

    瀏覽量

    54300
  • GDDR6
    +關(guān)注

    關(guān)注

    0

    文章

    52

    瀏覽量

    11623
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    高通挑戰(zhàn)英偉達,發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    億美元的數(shù)據(jù)中心市場中搶占一席之地。 就在10月28日,高通面向數(shù)據(jù)中心連發(fā)兩款AI芯片,AI200 和 AI250 芯片,打造下一代
    的頭像 發(fā)表于 10-29 10:36 ?3892次閱讀
    高通挑戰(zhàn)英偉達,發(fā)布768<b class='flag-5'>GB</b>內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數(shù)據(jù)中心

    高通挑戰(zhàn)英偉達!發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    億美元的數(shù)據(jù)中心市場中搶占一席之地。 ? 就在10月28日,高通面向數(shù)據(jù)中心連發(fā)兩款AI芯片,AI200 和 AI250 芯片,打造下一代
    的頭像 發(fā)表于 10-29 09:14 ?6685次閱讀
    高通挑戰(zhàn)英偉達!發(fā)布768<b class='flag-5'>GB</b>內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數(shù)據(jù)中心

    華為星河AI園區(qū)網(wǎng)絡(luò)登頂2025年中國市場榜首

    近日,根據(jù)國際權(quán)威調(diào)研機構(gòu)IDC發(fā)布的2025年最新市場統(tǒng)計數(shù)據(jù),華為星河AI園區(qū)網(wǎng)絡(luò)在中國市場多個核心領(lǐng)域強勢登頂,持續(xù)鞏固其全面領(lǐng)先的市場
    的頭像 發(fā)表于 03-31 11:29 ?455次閱讀

    彌合帶寬缺口,高性能AI推理如何受益于GDDR7?

    的轉(zhuǎn)變正在發(fā)生:AI推理正從集中式數(shù)據(jù)中心向網(wǎng)絡(luò)邊緣和終端設(shè)備遷移。這一趨勢涵蓋了從5G基礎(chǔ)設(shè)施到汽車、安防攝像頭和手機等終端設(shè)備在內(nèi)的廣泛領(lǐng)域。 在數(shù)字化轉(zhuǎn)型持續(xù)加速的高增長地區(qū),這種遷移趨勢尤為顯著。根據(jù)IDC數(shù)據(jù)顯示,2024年下半年,
    的頭像 發(fā)表于 03-18 09:11 ?502次閱讀
    彌合帶寬缺口,高性能<b class='flag-5'>AI</b><b class='flag-5'>推理</b>如何受益于<b class='flag-5'>GDDR</b>7?

    邊緣AI算力臨界點:深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值

    工業(yè)嵌入式和專業(yè)開發(fā)者的野心。 1、M.2 插槽 (PCIE4.0 X4) :這不僅是插硬盤的。PCIE4.0 X4提供了高達8GB/s的帶寬(單向)。這意味著它不僅支持NVMe SS
    發(fā)表于 03-10 14:19

    OrangePi RV2 深度技術(shù)評測:RISC-V AI融合架構(gòu)的先行者

    OrangePi RV2是香橙派推出的一款基于RISC-V架構(gòu)的AI開發(fā)板,搭載KY X1八核處理器。該板以“CPU 融合AI核心理念,內(nèi)置2TOPS算力,并支持雙M.2 NVMe
    發(fā)表于 03-03 20:19

    使用NORDIC AI的好處

    原始傳感器數(shù)據(jù),可顯著降低功耗、延長電池壽命。[Edge AI 概述; Nordic Edge AI 技術(shù)頁] 降低云依賴與時延 直接在設(shè)備上做推理,很多決策可以“本地實時”完成,不必等云端響應(yīng)
    發(fā)表于 01-31 23:16

    R480-X8面向下一代AI集群的高密度算力模塊:技術(shù)架構(gòu)與應(yīng)用分析

    基于開放計算標準(OCP OAI/OAM)設(shè)計的高密度AI加速器組,通過模塊化集成,在單一節(jié)點內(nèi)聚合高達1 PFLOPS(FP16)與2 POPS(INT8)的峰值算力。其配備大容量GDDR6內(nèi)存
    的頭像 發(fā)表于 12-14 13:15 ?1362次閱讀
    R480-X8面向下一代<b class='flag-5'>AI</b>集群的高密度算力模塊:技術(shù)架構(gòu)與應(yīng)用分析

    昆侖芯R200 AI加速卡技術(shù)規(guī)格解析

    昆侖芯R200加速卡基于7nm XPU-R架構(gòu),在150W功耗下提供256 TOPS INT8算力,側(cè)重高性能推理。配備最高32GB GDDR6內(nèi)存(512GB/
    的頭像 發(fā)表于 12-14 13:12 ?1854次閱讀
    昆侖芯R200 <b class='flag-5'>AI</b>加速卡技術(shù)規(guī)格解析

    RK3576驅(qū)動高端顯控系統(tǒng)升級:多屏拼控與AI視覺融合解決方案

    系統(tǒng)依賴多工控主機、外接顯卡和解碼器,存在功耗高、延遲大的問題。而瑞芯微 RK3576 打造的新一代 AI 多媒體平臺,憑借 “三屏異顯 + 八路攝像頭輸入 + AI 邊緣計算” 的架構(gòu),全面
    發(fā)表于 11-21 17:51

    BPI-AIM7 RK3588 AI與 Nvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    Banana Pi BPI-AIM7 RK3588 AI Module7 (AIM7) 配備 64 位八核處理器、6 TOPS NPU、8 GB 內(nèi)存、PCIe 3.0 支持以及軟件定
    發(fā)表于 10-11 09:08

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    和關(guān)聯(lián)性 AI驅(qū)動科學(xué):研究和模擬人類思維和認識過程。 本章節(jié)作者我們講解了第五范式,介紹了科學(xué)發(fā)現(xiàn)的一般方法和流程等。一、科學(xué)發(fā)現(xiàn)的5個范式 第一范式:產(chǎn)生于公元1000年左右的阿拉伯世界和歐洲
    發(fā)表于 09-17 11:45

    華為亮相2025金融AI推理應(yīng)用落地與發(fā)展論壇

    創(chuàng)新技術(shù)——UCM推理記憶數(shù)據(jù)管理器,旨在推動AI推理體驗升級,提升推理性價比,加速AI商業(yè)正循
    的頭像 發(fā)表于 08-15 09:45 ?1370次閱讀

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級

    器件敏捷調(diào)配。 定制化服務(wù):支持OEM/ODM/JDM模式,滿足客戶從標準品到液冷模塊的多元化需求。 這一優(yōu)勢已助力多家頭部云服務(wù)商在AI云平臺部署中搶占市場窗口期。 三、廣泛兼容性:平滑升級
    發(fā)表于 08-13 19:01

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    網(wǎng)絡(luò)智能診斷平臺。通過對私有化網(wǎng)絡(luò)數(shù)據(jù)的定向訓(xùn)練,信而泰打造了高性能、高可靠性的網(wǎng)絡(luò)診斷模型,顯著提升了AI輔助診斷的精準度與實用性。該方案實現(xiàn)了網(wǎng)絡(luò)全流量深度解析能力與AI智能推理
    發(fā)表于 07-16 15:29