chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

異構計算助拳,緩解參數(shù)服務器瓶頸

英特爾中國 ? 來源:英特爾中國 ? 作者:英特爾中國 ? 2022-07-10 10:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

昨晚睡得好嗎?睡不好可以刷快手的《11 點睡吧》。這部當代人睡眠困境的微綜藝,總曝光量達到 107 億,不但科普睡眠知識,更深度探討都市人的喜怒哀樂[1]。驚人的曝光量背后,是快手對用戶畫像數(shù)據(jù)的精準分析,離不開強大技術支持下的推薦系統(tǒng),得以讓優(yōu)質的內(nèi)容被更多喜歡它的人看到。

作為超 3 億日活、日均千萬級短視頻上傳、強調(diào)社區(qū)普惠的短視頻 APP,快手推薦系統(tǒng)在大規(guī)模復雜業(yè)務中面臨著巨大性能挑戰(zhàn)。想要化解算力瓶頸,異構計算是一個重要選項,這種使用不同類型指令集和體系架構的計算單元組成系統(tǒng)的計算方式,能夠針對不同任務選擇最優(yōu)的計算架構,從而充分揮各種計算機構的優(yōu)勢,協(xié)同完成復雜的工作任務。

1

異構計算助拳,緩解參數(shù)服務器瓶頸

快手作為短視頻內(nèi)容平臺,內(nèi)容生產(chǎn)、內(nèi)容理解、內(nèi)容分發(fā)、內(nèi)容消費、用戶互動這些環(huán)節(jié),構成了大規(guī)模的復雜業(yè)務,對算力產(chǎn)生更多元的需求。舉例來說:在推薦業(yè)務場景中,需要根據(jù)用戶畫像推薦感興趣的內(nèi)容,就要從海量信息中選擇與用戶特征相關的結果,再通過“排序”來劃分內(nèi)容的優(yōu)先級別。在這一過程中,參數(shù)服務器的作用非常重要,它負責存儲、處理海量數(shù)據(jù)特征以及排序模型參數(shù),保證任務高效、準確地完成。

8a99da9c-fea9-11ec-ba43-dac502259ad0.png

快手推薦系統(tǒng)采用計算與存儲分離的架構模式

快手的推薦系統(tǒng)為了應對海量數(shù)據(jù)沖擊,在架構上分離了計算與存儲。參數(shù)服務器屬于存儲型服務,該服務要保存和實時更新上億規(guī)模的用戶畫像、數(shù)十億規(guī)模的短視頻特征、以及千億規(guī)模的排序模型參數(shù)。受限于容量和帶寬的參數(shù)服務器,還要支撐每秒數(shù)億次的 KV 請求,耗費大量 CPU 資源。

要解決此類瓶頸,最佳方案是使用不同計算設備處理不同負載。快手的LaoFe NDP 近數(shù)據(jù)架構,在計算體系結構上實現(xiàn)創(chuàng)新,使用英特爾 至強可擴展處理器、英特爾Agilex FPGA和英特爾傲騰 持久內(nèi)存,借助軟硬一體化、領域專用加速器設計,從而做到網(wǎng)絡、存儲、計算三重加速,為各個業(yè)務系統(tǒng)提供低延遲、高并發(fā)、高吞吐、低總體擁有成本的基礎資源。

8ab88ca8-fea9-11ec-ba43-dac502259ad0.png

快手LaoFe NDP異構計算架構

2

持久內(nèi)存+FGPA 專用硬件,

確保三重加速創(chuàng)新

在網(wǎng)絡層面,LaoFe NDP 架構將 CPU的網(wǎng)絡數(shù)據(jù)處理轉移到英特爾 Stratix 10 FPGA 上,同時基于該 FPGA 實現(xiàn)了“軟件定義遠程直接內(nèi)存訪問”協(xié)議(SD-RDMA),大幅降低了請求延時。

在存儲層面,該架構打造了支持 SSD、英特爾 傲騰 持久內(nèi)存、以及 DRAM 的 Key-Value 存儲引擎,將 CPU 層面的存儲操作也轉移到 FPGA 中,最大程度發(fā)揮 FPGA 的能力,相比 CPU 方案,將存儲引擎的吞吐能力提升 5 倍以上。該引擎還利用英特爾 傲騰 持久內(nèi)存的特性,讓基于異構存儲的索引系統(tǒng)幾乎達到純 DRAM 相同的性能指標,成本降低 30%。同時相比之前小時級的故障恢復速度,異構存儲的索引系統(tǒng)只需幾分鐘就能重新上線。

LaoFe NDP 的計算加速仰仗 FPGA 作為領域專用處理,可以更有效地并行處理數(shù)據(jù),提供更高效的內(nèi)存層次結構與定制化的執(zhí)行單元,從而支持機器學習深度學習和大數(shù)據(jù)等場景。英特爾 FPGA 具備富于彈性的可編程硬件能力,延時低且可精確控制,單位算力功耗低、片上內(nèi)存大,適合于快手延時要求高、批處理比較小、并發(fā)性和重復性強的應用場景。

8ac6f964-fea9-11ec-ba43-dac502259ad0.png

快手LaoFe NDP 架構在英特爾軟硬件優(yōu)化下,最終實現(xiàn)了如下優(yōu)勢:

■系統(tǒng)吞吐顯著提升,延時顯著降低:參數(shù)服務器的吞吐性能提升了 5-6 倍,整體請求延時降低了 70%-80%,提供更好的用戶體驗。

■更好地控制 TCO:FPGA 的強大性能提供遠超傳統(tǒng)方案的吞吐能力,僅需部署少量的服務器就能滿足特性的性能指標要求,替代比可達到1:5,有效降低 TCO。

■降低性能抖動:基于CPU的軟件方案常因需要進行高頻率更新而出現(xiàn)性能抖動,而通過FPGA來處理負載,能大幅減少性能抖動。

通過快手的實踐能夠看出,以異構計算加速不同負載,能夠顯著提升在推薦等場景下的系統(tǒng)吞吐與延時表現(xiàn)。未來,英特爾還會和快手等合作伙伴一起,推進面向未來數(shù)據(jù)中心的異構參考架構,通過 CPU、IPU、XPU 的產(chǎn)品組合以及軟件堆棧,以及智能網(wǎng)絡結構,提供跨越整個數(shù)據(jù)管道的解決方案,高效挖掘海量數(shù)據(jù)中的智慧,讓用戶與用戶、用戶與內(nèi)容、用戶與商品可及時按需建立高效、有溫度的連接互動。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10296

    瀏覽量

    180238
  • 服務器
    +關注

    關注

    14

    文章

    10223

    瀏覽量

    91413
  • 異構計算
    +關注

    關注

    2

    文章

    112

    瀏覽量

    17167

原文標題:英特爾助力快手實現(xiàn)異構計算加速,顯著提升性能,降低系統(tǒng)TCO

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    什么是企業(yè)云服務器-云計算

    企業(yè)云服務器是指為企業(yè)提供的基于云計算技術的服務器解決方案。華納云是一家云計算服務提供商,為企業(yè)客戶提供云
    的頭像 發(fā)表于 12-29 17:57 ?729次閱讀

    結合AI算法的邊緣計算服務器,在城市管理場景有什么作用?

    在智慧城市建設的棋盤上,邊緣計算服務器正成為激活全城AI細胞的"神經(jīng)突觸"。當算法模型走出數(shù)據(jù)中心,通過邊緣計算服務器、邊緣計算盒子、邊緣
    的頭像 發(fā)表于 10-17 15:31 ?421次閱讀
    結合AI算法的邊緣<b class='flag-5'>計算</b><b class='flag-5'>服務器</b>,在城市管理場景有什么作用?

    異構計算解決方案(兼容不同硬件架構)

    異構計算解決方案通過整合不同類型處理(如CPU、GPU、NPU、FPGA等),實現(xiàn)硬件資源的高效協(xié)同與兼容,滿足多樣化計算需求。其核心技術與實踐方案如下: 一、硬件架構設計 異構處理
    的頭像 發(fā)表于 06-23 07:40 ?818次閱讀

    如何釋放異構計算的潛能?Imagination與Baya Systems的系統(tǒng)架構實踐啟示

    報告作者:PallaviSharma,Imaginaiton產(chǎn)品管理總監(jiān)Dr.EricNorige,BayaSystems首席軟件架構師關注Imagination公眾號,消息框發(fā)送【異構計算】,即可
    的頭像 發(fā)表于 06-13 08:33 ?1098次閱讀
    如何釋放<b class='flag-5'>異構計算</b>的潛能?Imagination與Baya Systems的系統(tǒng)架構實踐啟示

    AIO-GS1N2:雙核異構服務器主板

    的超大容量SSD。適用于智能網(wǎng)關服務器等類型產(chǎn)品及多個行業(yè)領域。雙核心板模組設計主板采用雙核心異構設計,兩核心模組獨立工作,其一模組可執(zhí)行通用計算,另一模組進行AI
    的頭像 發(fā)表于 06-11 16:32 ?912次閱讀
    AIO-GS1N2:雙核<b class='flag-5'>異構</b>的<b class='flag-5'>服務器</b>主板

    能效提升3倍!異構計算架構讓AI跑得更快更省電

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)異構計算架構通過集成多種不同類型的處理單元(如CPU、GPU、NPU、FPGA、DSP等),針對不同計算任務的特點進行分工協(xié)作,從而在性能、能效和靈活性之間實現(xiàn)最優(yōu)平衡
    的頭像 發(fā)表于 05-25 01:55 ?3935次閱讀

    ARM服務器解決方案

    ARM服務器解決方案已成為異構計算領域的重要技術路徑,其核心優(yōu)勢與多元化場景適配性正加速產(chǎn)業(yè)滲透。以下為關鍵要點分析: 一、核心優(yōu)勢與架構設計 能效比優(yōu)化? ARM架構基于RISC指令集,單節(jié)點功耗
    的頭像 發(fā)表于 05-16 07:44 ?1065次閱讀
    ARM<b class='flag-5'>服務器</b>解決方案

    邊緣計算服務器

    邊緣計算服務器是支撐邊緣計算模式落地的核心硬件設備,其定義及特性可歸納如下: 一、定義 邊緣計算服務器指部署在網(wǎng)絡邊緣側的專用
    的頭像 發(fā)表于 04-29 07:46 ?804次閱讀

    國外bgp服務器多少錢?# 服務器

    服務器
    jf_57681485
    發(fā)布于 :2025年04月24日 14:19:00

    SoC集群服務器 與 ARM架構陣列服務器 關系

    一、定義與定位 SoC集群服務器? 以系統(tǒng)級芯片(SoC)為核心算力單元,通過高速網(wǎng)絡將多節(jié)點互聯(lián)形成的分布式計算集群。每個SoC芯片集成CPU、GPU、NPU等多種處理單元,并支持多核異構計算
    的頭像 發(fā)表于 04-24 07:49 ?951次閱讀
    SoC集群<b class='flag-5'>服務器</b> 與 ARM架構陣列<b class='flag-5'>服務器</b> 關系

    新加坡服務器延遲大嗎?真相在這里#新加坡服務器 #服務器

    服務器
    jf_57681485
    發(fā)布于 :2025年04月18日 13:48:50

    RAKsmart智能算力架構:異構計算+低時延網(wǎng)絡驅動企業(yè)AI訓練范式升級

    在AI大模型參數(shù)量突破萬億、多模態(tài)應用爆發(fā)的今天,企業(yè)AI訓練正面臨算力效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能算力架構,以異構計算資源池化與超低時延網(wǎng)絡為核心,重構AI訓練基礎設施,助力企業(yè)實現(xiàn)訓練速度提升、硬件成本下降與算法迭代加速的三重突破。
    的頭像 發(fā)表于 04-17 09:29 ?748次閱讀

    DeepSeek企業(yè)級部署服務器資源計算 以raksmart裸機云服務器為例

    以RakSmart裸機云服務器為例,針對DeepSeek企業(yè)級部署的服務器資源計算指南,涵蓋GPU/CPU/內(nèi)存/存儲/網(wǎng)絡等核心維度的詳細計算方法與配置推薦,主機推薦小編為您整理發(fā)布
    的頭像 發(fā)表于 03-21 10:17 ?1053次閱讀

    NTP校時服務器 時鐘同步服務器

    服務器
    jf_75250307
    發(fā)布于 :2025年03月19日 20:56:34