chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

今天發(fā)布!詳解賽靈思加速卡Alveo U50的輕與重

堅(jiān)白 ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:陸楠,電子發(fā)燒友 ? 2019-08-07 09:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

目前,數(shù)據(jù)中心在異構(gòu)計(jì)算和算法標(biāo)準(zhǔn)上不斷變化,越來(lái)越多的應(yīng)用領(lǐng)域需要專(zhuān)用的架構(gòu),使得硬件能夠和算法去進(jìn)行匹配以達(dá)到最佳運(yùn)行效果或者是提高它的運(yùn)行速度。網(wǎng)絡(luò)上有很多不同的數(shù)據(jù),這些數(shù)據(jù)在運(yùn)行過(guò)程當(dāng)中有不同的要求,而且網(wǎng)絡(luò)自身也在不斷迭代,計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)對(duì)加速的要求都在水漲船高。對(duì)于硬件而言,理想的方式是能在不改變硬件的情況下,加速任何工作負(fù)載,并能降低總體擁有成本。
針對(duì)這一需求趨勢(shì),去年10月份的時(shí)候,賽靈思推出了Alveo系列加速卡。賽靈思數(shù)據(jù)中心業(yè)務(wù)部產(chǎn)品規(guī)劃和市場(chǎng)營(yíng)銷(xiāo)總監(jiān)Jamon Bowen將這一系列產(chǎn)品的規(guī)劃目的總結(jié)為三個(gè):快速、靈活應(yīng)變和方便易用。即高吞吐量同時(shí)具有超低時(shí)延,能夠?yàn)槎喾N工作負(fù)載進(jìn)行加速,并且可以運(yùn)用于云和本地各種場(chǎng)景。Alveo系列包括U200、U250和U280,區(qū)別主要是FPGA中的LUT規(guī)模和總線資源。今天,該公司宣布推出了Alveo系列最新的一款加速卡Alveo U50。

輕——輕量級(jí)加速

和該系列之前的產(chǎn)品不同,Alveo U50是業(yè)界首款輕量級(jí)PCIe Gen4自適應(yīng)計(jì)算加速卡,并且面向所有服務(wù)器、各種云和邊緣的數(shù)據(jù)中心應(yīng)用,包括網(wǎng)絡(luò)和存儲(chǔ)加速?!斑@是之前的產(chǎn)品做不到的?!盉owen說(shuō)。
圖:從賽靈思提供的資料看,U50似乎是U280的迷你版。
Alveo U50支持PCIe Gen4這一最新的服務(wù)器總線和CCIX互聯(lián)標(biāo)準(zhǔn),不同于GPU加速器的尺寸,U50要小的多,“GPU加速器的尺寸適合電腦,但不適用于網(wǎng)絡(luò)和存儲(chǔ),”Bowen說(shuō),“采用賽靈思UltraScale+架構(gòu)以及集成超高帶寬的HBM2存儲(chǔ)器技術(shù)大大減少了U50的尺寸?!?/div>
采用HBM2這種片上存儲(chǔ)不僅僅是出于體積的考慮,還在于這能提升性能——HBM性能是DDR的10倍。U50內(nèi)置8GB HBM2,可實(shí)現(xiàn)超過(guò)400Gbps的數(shù)據(jù)傳輸速度。PCIe Gen4也是目前最快的總線技術(shù),這些都是存儲(chǔ)加速的要素。在網(wǎng)絡(luò)端口方面,U50的QSFP28端口可以實(shí)現(xiàn)100Gbps的網(wǎng)絡(luò)連接,并支持多種前沿應(yīng)用,如VMe-oF(NVM Express over Fabrics)、解耦計(jì)算存儲(chǔ)和專(zhuān)業(yè)金融服務(wù)應(yīng)用。滿足所有這些性能只需要不到75W的功耗,這可以讓很多應(yīng)用不再為功耗預(yù)算而擔(dān)心。
在一組針對(duì)語(yǔ)音翻譯(深度學(xué)習(xí)推斷加速)、數(shù)據(jù)庫(kù)分析(數(shù)據(jù)分析加速)、數(shù)據(jù)壓縮(計(jì)算存儲(chǔ)加速)、電子交易(網(wǎng)絡(luò)加速)和金融建模(網(wǎng)格計(jì)算)的加速測(cè)試中,與GPU和CPU加速相比,U50的表現(xiàn)優(yōu)異。其中,語(yǔ)音翻譯的時(shí)延降低25倍,吞吐量擴(kuò)大10倍,在翻譯性能方面,和英偉達(dá)T4 相比,U50 性能提升高達(dá)10倍;在運(yùn)行TPC-H Query基準(zhǔn)測(cè)試(數(shù)據(jù)庫(kù)分析)時(shí),相比CPU,U50每小時(shí)吞吐量提升4倍,運(yùn)營(yíng)成本降低3倍;在數(shù)據(jù)壓縮上,U50將壓縮/解壓縮吞吐量提高了20倍,實(shí)現(xiàn)了更快的Hadoop和大數(shù)據(jù)分析,同時(shí)相比僅CPU節(jié)點(diǎn)將每節(jié)點(diǎn)成本降低了40%;在電子交易中,U50相比僅CPU的10us延時(shí),能將時(shí)延降低20%,交易時(shí)間不到500ns;在金融建模時(shí),運(yùn)行蒙特卡洛模擬,U50的功效相比GPU提升了7倍。
圖:U50在吞吐量,延遲和功效方面實(shí)現(xiàn)了10-20倍的改善
總的來(lái)說(shuō),U50在吞吐量,延遲和功效方面實(shí)現(xiàn)了10-20倍的改善?!拔覀兊膽?zhàn)略是致力于讓賽靈思靈活應(yīng)變的加速技術(shù)應(yīng)用于數(shù)據(jù)中心的所有領(lǐng)域,具體來(lái)說(shuō)就是計(jì)算、網(wǎng)絡(luò)和存儲(chǔ),”Bowen說(shuō),“所有的計(jì)算工作負(fù)載都是這三個(gè)領(lǐng)域的一部分,這也是我們看到Alveo可以大展宏圖的地方?!?/div>

重——兩個(gè)重要堆棧

計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)為什么需要加速?因?yàn)橹T如AlexNet、GoogleNet、DenseNet這些網(wǎng)絡(luò)結(jié)構(gòu)都需要不同的硬件架構(gòu)來(lái)實(shí)現(xiàn)高吞吐量、低時(shí)延和高效率。對(duì)于應(yīng)用而言,加速可以靈活適應(yīng)不同的需求。而數(shù)據(jù)中心要優(yōu)化性能,需要定制數(shù)據(jù)路徑、定制精度和定制存儲(chǔ)器層級(jí),沒(méi)有比可編程的硬件更適合來(lái)進(jìn)行定制化的加速了。不過(guò),對(duì)于數(shù)據(jù)中心開(kāi)發(fā)者而言,F(xiàn)PGA編程是個(gè)令人頭痛的事情。
“我們從數(shù)據(jù)中心的客戶那里聽(tīng)到的一個(gè)最大的抱怨就是FPGA的編程非常困難,”Bowen說(shuō),“Alveo提供開(kāi)放的平臺(tái)和開(kāi)發(fā)環(huán)境,讓開(kāi)發(fā)者能夠更加便捷地使用,隨著越來(lái)越多的開(kāi)發(fā)者到這個(gè)平臺(tái)上來(lái)開(kāi)發(fā),會(huì)有更多的云和相關(guān)產(chǎn)品加入,并且能夠?qū)崿F(xiàn)原來(lái)只有在軟件部分才有可能實(shí)現(xiàn)的硬件IP的靈活應(yīng)變能力。”
對(duì)于賽靈思而言,這個(gè)開(kāi)放平臺(tái)正在形成一個(gè)解決方案的堆棧,好消息是,自去年10月份推出Alveo以來(lái),目前已發(fā)布的應(yīng)用已經(jīng)是當(dāng)初的2倍,而其培訓(xùn)的開(kāi)發(fā)者已經(jīng)是當(dāng)初的4倍。
圖:解決方案堆棧
開(kāi)發(fā)堆棧解決了FPGA加速卡的開(kāi)發(fā)難題,接下來(lái)就是大規(guī)模部署落地的難題。Alveo系列的應(yīng)用領(lǐng)域包括數(shù)據(jù)分析、視頻與圖象處理、機(jī)器學(xué)習(xí)、生命科學(xué)和金融計(jì)算——不僅是云的覆蓋,還要部署落地。在諸多調(diào)動(dòng)IT業(yè)者積極性的因素中,“充分商業(yè)化的標(biāo)準(zhǔn)化產(chǎn)品”是重要的一個(gè),這使得賽靈思的標(biāo)準(zhǔn)產(chǎn)品的開(kāi)源框架很容易被Kubernetes和docker這類(lèi)免費(fèi)的微服務(wù)內(nèi)容平臺(tái)連接。
“因?yàn)槲覀兪且粋€(gè)非常標(biāo)準(zhǔn)化的產(chǎn)品,所以Kubernetes可以在系統(tǒng)內(nèi)反映出Alveo插件,開(kāi)發(fā)者也可以把它和docker配合起來(lái),通過(guò)對(duì)Alveo進(jìn)行編程而在系統(tǒng)中體現(xiàn)出加速應(yīng)用?!盉owen解釋道,“所有編排、云管理和應(yīng)用都和這些免費(fèi)的生態(tài)系統(tǒng)結(jié)合,如果沒(méi)有這樣一個(gè)標(biāo)準(zhǔn)化的產(chǎn)品配置,客戶可能需要花費(fèi)大量的投資才能夠?qū)崿F(xiàn)這樣一個(gè)功能,這對(duì)于一些超大規(guī)模數(shù)據(jù)中心的應(yīng)用來(lái)說(shuō)是非常有必要的,既可以在云端,也可以用Alveo在本地進(jìn)行加速,而且是一個(gè)非常開(kāi)放式的框架,可以進(jìn)行全面的加速?!?/strong>
這個(gè)生態(tài)就是一個(gè)大規(guī)模部署堆棧,賽靈思在其中開(kāi)發(fā)了一個(gè)標(biāo)準(zhǔn)框架,然后提供Alveo產(chǎn)品,讓開(kāi)發(fā)者像加速軟件那樣給服務(wù)器加速——重要的是,通過(guò)開(kāi)發(fā)這個(gè)標(biāo)準(zhǔn)框架,賽靈思決定了應(yīng)用場(chǎng)景的加速方式。
圖:大規(guī)模部署堆棧
據(jù)悉,賽靈思選擇在今天(8月7日)發(fā)布Alveo U50,是因?yàn)檫@兩天(8月6-8日),閃存峰會(huì)(Flash Memory Summit (FMS) 2019)正在美國(guó)加州圣克拉拉會(huì)議中心舉辦,賽靈思執(zhí)行副總裁兼數(shù)據(jù)中心部總經(jīng)理Salil Raje將發(fā)表有關(guān)高速存儲(chǔ)系統(tǒng)加速的的主題演講,該公司同時(shí)也會(huì)在現(xiàn)場(chǎng)演示這款最新的產(chǎn)品。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 賽靈思
    +關(guān)注

    關(guān)注

    33

    文章

    1798

    瀏覽量

    133632
  • 加速卡
    +關(guān)注

    關(guān)注

    1

    文章

    75

    瀏覽量

    11361
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    選擇AMD Alveo V80加速卡的五大理由

    AMD Alveo V80 加速卡專(zhuān)為需要實(shí)時(shí)加速的企業(yè)數(shù)據(jù)中心和云服務(wù)提供商而設(shè)計(jì),它結(jié)合了可編程邏輯、片上高帶寬內(nèi)存( HBM )、高速網(wǎng)絡(luò)核心以及網(wǎng)絡(luò)直連接口,可實(shí)現(xiàn)實(shí)時(shí)性能。Alveo
    的頭像 發(fā)表于 04-10 14:59 ?255次閱讀

    FPGA電源解決方案全解析

    FPGA電源解決方案全解析 在當(dāng)今的電子設(shè)計(jì)領(lǐng)域,現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)憑借其出色的設(shè)計(jì)靈活性和較低的工程成本,在眾多應(yīng)用和終端市場(chǎng)中占據(jù)了重要地位。然而,F(xiàn)PGA的電源設(shè)計(jì)和管理卻是一
    的頭像 發(fā)表于 04-02 15:45 ?169次閱讀

    AMD Alveo MA35D媒體加速卡的AMA SDK 1.4.0版本發(fā)布

    我們非常高興地宣布,面向 AMD Alveo MA35D 媒體加速卡的最新 AMA SDK 1.4.0 版本現(xiàn)已發(fā)布。該版本旨在為要求嚴(yán)苛的媒體工作負(fù)載提供堅(jiān)如磐石的穩(wěn)定性和性能提升。此次更新體現(xiàn)了我們致力于優(yōu)化平臺(tái)以適應(yīng)生產(chǎn)環(huán)
    的頭像 發(fā)表于 03-19 09:36 ?589次閱讀

    FPGA硬件加速卡設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高, XCKU115, 光纖采集, 信號(hào)計(jì)算板, 硬件加速卡
    的頭像 發(fā)表于 02-12 09:52 ?518次閱讀
    FPGA硬件<b class='flag-5'>加速卡</b>設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件<b class='flag-5'>加速卡</b> PCIe半高 XCKU115-3-FLVF1924-E芯片

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN標(biāo)準(zhǔn)嵌入式開(kāi)發(fā)板

    LLM-8850KitLLM-8850Kit是一款面向邊緣AI與嵌入式計(jì)算場(chǎng)景的高性能AI加速卡套件,由LLM-8850CardAI加速卡與LLM-8850PiHat轉(zhuǎn)接板組成。核心加速卡
    的頭像 發(fā)表于 01-30 16:11 ?1342次閱讀
    新品 | LLM-8850 Kit,高性能AI<b class='flag-5'>加速卡</b>套件 DinMeter v1.1,1/32DIN標(biāo)準(zhǔn)嵌入式開(kāi)發(fā)板

    高速信號(hào)處理設(shè)計(jì)方案:413-基于雙XCVU9P+C6678的100G光纖加速卡

    C6678, XCVU9P, ZU19EG開(kāi)發(fā)板,, 高速信號(hào)處理, 光纖加速卡, XCVU9P光纖加速卡
    的頭像 發(fā)表于 01-08 16:06 ?430次閱讀
    高速信號(hào)處理設(shè)計(jì)方案:413-基于雙XCVU9P+C6678的100G光纖<b class='flag-5'>加速卡</b>

    福田BEACON正式發(fā)布量產(chǎn)版

    2025年12月18日,福田BEACON正式發(fā)布量產(chǎn)版,攜純電、氣氫、液氫三款量產(chǎn)產(chǎn)品與公眾見(jiàn)面,其中,液氫產(chǎn)品是行業(yè)首個(gè)將只應(yīng)用于航空航天領(lǐng)域的液氫能源突破性地應(yīng)用于量產(chǎn)化的
    的頭像 發(fā)表于 12-25 16:18 ?919次閱讀

    3U VPX板卡設(shè)計(jì)原理圖:821-基于RFSOC的8路5G ADC和8路9G的DAC 3U VPX

    3uvpx板卡, DA輸出核心板, RFSOC, XCVU9P芯片, 信號(hào)輸出播放, 硬件加速卡, 3U VPX板卡
    的頭像 發(fā)表于 12-18 14:18 ?561次閱讀
    3<b class='flag-5'>U</b> VPX板卡設(shè)計(jì)原理圖:821-基于RFSOC的8路5G ADC和8路9G的DAC 3<b class='flag-5'>U</b> VPX<b class='flag-5'>卡</b>

    深圳光量子工廠啟示:PCI 加速卡為何偏向 25MHz 2016 有源晶振?

    在 PCI?加速卡項(xiàng)目中,工程師使用SJK 2016?系列有源晶振?25MHZ。原因不僅僅是規(guī)格匹配,更在于系統(tǒng)復(fù)雜度。
    的頭像 發(fā)表于 12-12 16:43 ?1331次閱讀
    深圳光量子工廠啟示:PCI <b class='flag-5'>加速卡</b>為何偏向 25MHz 2016 有源晶振?

    算力密度翻倍!江原D20加速卡發(fā)布,一雙芯重構(gòu)AI推理標(biāo)桿

    的關(guān)鍵技術(shù)瓶頸。 ? 在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月實(shí)現(xiàn)量產(chǎn)交付。在大算力AI芯片全流程國(guó)產(chǎn)化產(chǎn)業(yè)鏈實(shí)現(xiàn)首次突破后,11月11日,江原科技再次發(fā)布新一代全國(guó)產(chǎn)AI加速卡——江原D20
    的頭像 發(fā)表于 11-14 08:21 ?1.1w次閱讀
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b><b class='flag-5'>發(fā)布</b>,一<b class='flag-5'>卡</b>雙芯重構(gòu)AI推理標(biāo)桿

    虛擬電廠加速卡不是噱頭!萬(wàn)點(diǎn)規(guī)模VPP的性能分水嶺

    。 ? 此時(shí)僅靠邊緣MPU/CPU的通用算力,可能無(wú)法及時(shí)處理數(shù)據(jù)清洗、異常檢測(cè)、指令下發(fā)校驗(yàn)等任務(wù),而加速卡(如 GPU、FPGA 加速卡)的并行計(jì)算能力可快速消化數(shù)據(jù)洪流,避免“小包風(fēng)暴”導(dǎo)致的系統(tǒng)頓。 ? 虛擬電廠對(duì)AG
    的頭像 發(fā)表于 10-10 08:59 ?2801次閱讀

    智算加速卡是什么東西?它真能在AI戰(zhàn)場(chǎng)上干掉GPU和TPU!

    隨著AI技術(shù)火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計(jì)算",可真到了落地環(huán)節(jié),算力才是硬通貨。你有沒(méi)有發(fā)現(xiàn),現(xiàn)在越來(lái)越多的AI企業(yè)不光用GPU,也不怎么迷信TPU了?他們嘴里多了一個(gè)新詞兒——智算加速卡
    的頭像 發(fā)表于 06-05 13:39 ?1858次閱讀
    智算<b class='flag-5'>加速卡</b>是什么東西?它真能在AI戰(zhàn)場(chǎng)上干掉GPU和TPU!

    410?基于?XCVU9P+?C6678?的?100G?光纖的加速卡

    基于 XCVU9P+ C6678 的 100G 光纖的加速卡
    的頭像 發(fā)表于 05-08 08:32 ?850次閱讀
    410?基于?XCVU9P+?C6678?的?100G?光纖的<b class='flag-5'>加速卡</b>

    邊緣AI運(yùn)算革新 DeepX DX-M1 AI加速卡結(jié)合Rockchip RK3588多路物體檢測(cè)解決方案

    DeepX 推出了一款革命性的產(chǎn)品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具備高達(dá) 25 TOPS 的卓越運(yùn)算性能,以及高準(zhǔn)確度、低功耗、低溫
    的頭像 發(fā)表于 05-06 14:15 ?1249次閱讀
    邊緣AI運(yùn)算革新 DeepX DX-M1 AI<b class='flag-5'>加速卡</b>結(jié)合Rockchip RK3588多路物體檢測(cè)解決方案

    寒武紀(jì)基于思元370芯片的MLU370-X8 智能加速卡產(chǎn)品手冊(cè)詳解

    MLU370-X8智能加速卡是全面升級(jí)的數(shù)據(jù)中心訓(xùn)推一體AI加速卡,基于寒武紀(jì)全新一代元370芯片,接口為PCIe 4.0 X16,是全高全長(zhǎng)雙寬(FHFL-Dual-Slot)的標(biāo)準(zhǔn)PCIe
    的頭像 發(fā)表于 04-24 17:57 ?6032次閱讀
    寒武紀(jì)基于思元370芯片的MLU370-X8 智能<b class='flag-5'>加速卡</b>產(chǎn)品手冊(cè)<b class='flag-5'>詳解</b>