在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網(wǎng)絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現(xiàn)了在 AI 網(wǎng)絡、存儲和安全等領域的創(chuàng)新突破。
由劉松,雷瑋琛,張琳,高鎧煒,苑新婧組成的 FireMoth42 團隊憑借其項目“基于 NVIDIA BlueField DPU 的 5G UPF 數(shù)據(jù)面加速方案”,成功將 5G 用戶面功能(UPF)卸載到 DPU,實現(xiàn)了數(shù)據(jù)面的加速和低時延處理,為邊緣網(wǎng)絡架構帶來新的可能。
聚焦可編程網(wǎng)絡 從實驗到項目落地
FireMoth42 團隊的研究方向長期聚焦于可編程網(wǎng)絡、5G 與邊緣計算的發(fā)展。在實際研究與行業(yè)調(diào)研中,他們注意到:隨著網(wǎng)絡流量和用戶數(shù)量急劇增長,UPF 已成為電信網(wǎng)絡核心網(wǎng)的性能瓶頸之一。而 NVIDIA BlueField DPU 的推出,為他們提供了將數(shù)據(jù)面(UPF)處理任務從通用服務器卸載到 DPU 專用加速硬件的絕佳契機。
“基于 DOCA Flow 庫,我們在 NVIDIA BlueField DPU 上實現(xiàn)了 UPF 的數(shù)據(jù)面處理,并設計了一套針對大流與小流的差異化轉(zhuǎn)發(fā)策略,”團隊介紹道,“大流通過 eSwitch 直接轉(zhuǎn)發(fā),小流則由 CPU 處理,從而在性能與資源之間取得最優(yōu)平衡。”
深挖 DOCA 官方文檔 破局開發(fā)瓶頸
由于 DOCA Flow 庫是一個高度抽象的庫,團隊在開發(fā)初期并未能查看到流處理的匹配路徑和狀態(tài)變化,這導致了一些未知錯誤,比如數(shù)據(jù)包并未按照設計的匹配條件進行正確轉(zhuǎn)發(fā),并在 pipe 串聯(lián)處理數(shù)量超過 15 個時還出現(xiàn)了數(shù)據(jù)流處理性能下降的問題。團隊想要定位這些錯誤和問題出現(xiàn)了較大困難,故在程序調(diào)試上耗費了較多的時間,當然這也極大的考驗了團隊的耐心與協(xié)作能力。
面對這些挑戰(zhàn),團隊采取了多管齊下的策略。首先,他們深入查閱了 DOCA 官方文檔和 SDK 示例,積極向 NVIDIA 導師團隊請教,在導師的幫助下逐步厘清了開發(fā)框架中的多個關鍵概念,加速了團隊對 DOCA Flow 架構的理解。
其次,團隊還采取“反復嘗試+精細驗證”的策略。在調(diào)試過程中,重復執(zhí)行“注釋和添加代碼——編譯——運行——測試”的閉環(huán)流程。通過對代碼邏輯進行精細拆分與變動,逐步縮小問題范圍,嘗試各種可能的配置組合,從而找出導致行為異常的根本原因。
此外,為了解決性能瓶頸定位難的問題,團隊還編寫了一系列 DOCA Flow 測試程序,通過簡化邏輯、控制變量,逐步推導出 pipe 串聯(lián)與表項下發(fā)的最佳實踐,為后續(xù)優(yōu)化提供了堅實依據(jù)。
流量分發(fā)邏輯的全面創(chuàng)新
本項目的核心創(chuàng)新在于實現(xiàn)了 5G UPF 從通用 CPU 到BlueField DPU的卸載與加速。團隊不僅將數(shù)據(jù)面轉(zhuǎn)發(fā)邏輯遷移至 BlueField DPU,還結合了實際網(wǎng)絡流量在大、小流上的差異特征,設計了一套基于流量分類的轉(zhuǎn)發(fā)策略:將大流直接通過 eSwitch 轉(zhuǎn)發(fā),以降低 CPU 干預和轉(zhuǎn)發(fā)延遲;而將小流保留在 CPU 側處理,實現(xiàn)資源分配的最優(yōu)化。
在應用落地方面,該方案特別適用于未來的邊緣電信場景,尤其是 MEC(邊緣計算)架構下的小型數(shù)據(jù)中心或邊緣匯聚點。相比傳統(tǒng)方案,基于 DPU 的 UPF 加速模型不僅具備更低的時延、更優(yōu)的能耗效率,還能有效釋放邊緣機房中寶貴的 CPU 資源,將其用于更多控制面、業(yè)務邏輯和 AI 推理等其他處理任務。
DOCA 開發(fā)者快問快答
Q
您是從哪里了解到 NVIDIA DPU 黑客松競賽的?參賽的目標是什么?
A
我們在搜索 BlueField DPU 資料時通過知乎和搜索引擎了解到此次競賽。參賽是為了系統(tǒng)的學習和使用 DOCA SDK,并與業(yè)界同行交流。
Q
賽前舉辦的 DPU 線上技術訓練營對您的備賽起到哪些幫助?
A
在訓練營中,NVIDIA 導師系統(tǒng)講解了 DPU 架構、DOCA 軟件棧以及典型開發(fā)案例。這幫我們快速建立了對 DOCA 開發(fā)框架和 BlueField 應用場景的整體認知,尤其是 DOCA Flow 的處理機制和代碼實例,為我們節(jié)省了大量入門時間。
Q
參與 NVIDIA DPU 黑客松競賽有哪些收獲?
A
此次競賽對我們來說是一次完整的系統(tǒng)級工程開發(fā)體驗。從搭建環(huán)境、明確需求、模塊劃分到調(diào)試聯(lián)通,每一步都考驗團隊協(xié)作與問題解決能力。我們不僅掌握了 DOCA 開發(fā)的核心流程,也深刻體會到 DPU 技術在現(xiàn)代網(wǎng)絡基礎設施中的應用潛力。
Q
本次競賽有沒有難忘或有趣的經(jīng)歷?
A
太多了,有一次因為少寫一個下發(fā)語句,導致表項遲遲不生效,排查了 40 多分鐘才找到問題。還有一次因字節(jié)序問題導致 ARM 側計算結果完全顛倒。解決這些問題的過程既痛苦又充滿成就感。
Q
團隊里是否有女性開發(fā)者?她們發(fā)揮了怎樣的作用?
A
我們團隊共有兩位女性成員,她們不僅參與核心架構設計,還在代碼實現(xiàn)、性能測試、調(diào)試驗證中發(fā)揮關鍵作用。她們思維細膩、耐心包容,經(jīng)常能在團隊陷入困境時提出新思路,也是團隊的“粘合劑”,增強了整體凝聚力。
這次競賽也讓我們意識到,技術從不是某類群體的專屬舞臺,而是每一個熱愛探索、勇于挑戰(zhàn)的開發(fā)者共同創(chuàng)造的空間。
Q
什么契機讓您成為 DOCA 開發(fā)者?
A
我們實驗室的研究方向本身就聚焦于可編程網(wǎng)絡,而其中最重要的設備類型就是可編程交換機與智能網(wǎng)卡。BlueField DPU 正是智能網(wǎng)卡領域中的代表性硬件,它不僅在工業(yè)界的實際部署中表現(xiàn)優(yōu)異,在學術研究中也逐漸成為熱點。因此,作為研究生,我們也想探索 BlueFiled 的強大功能,故而逐步走上了 DOCA 開發(fā)者的道路。
Q
您對 DOCA 和DOCA 中國開發(fā)者社區(qū)有何評價?
A
DOCA 是我們用過文檔最完整、功能也最豐富的網(wǎng)絡加速開發(fā)工具之一。無論是開發(fā)框架、API 文檔,還是代碼示例,整體結構都非常清晰,對新手來說也非常友好。
DOCA 中國開發(fā)者社區(qū)也給了我們很多幫助。無論是查資料、問問題,還是參與線上活動、獲取導師建議,都非常高效。社區(qū)里的技術氛圍也很好,很適合成長、交流和結識志同道合的伙伴。
開發(fā)者寄語
“技術的賽場不分性別,而是每一個熱愛探索的人的共同舞臺。歡迎更多同學加入 DPU 與 DOCA 的開發(fā)行列,在邊緣智能與網(wǎng)絡創(chuàng)新的浪潮中,寫下屬于你們的代碼故事!”
-
NVIDIA
+關注
關注
14文章
5581瀏覽量
109611 -
服務器
+關注
關注
14文章
10223瀏覽量
91409 -
DPU
+關注
關注
0文章
414瀏覽量
26901
原文標題:開發(fā)者故事 | 將 5G UPF 卸載至 DPU,實現(xiàn)邊緣網(wǎng)絡數(shù)據(jù)面加速
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
5G基站電源防護方案
NVIDIA BlueField-4數(shù)據(jù)處理器重塑新型AI原生存儲基礎設施
5G網(wǎng)絡通信有哪些技術痛點?
華為ICNMaster解決方案助力5G業(yè)務高效運營
NVIDIA在ISC 2025分享最新超級計算進展
NVIDIA推出全新BlueField-4 DPU
5G與6G:從“萬物互聯(lián)“到“智能無界“的跨越
NVIDIA助力Axio團隊打造全新DPU數(shù)據(jù)面開發(fā)框架
科普 | 5G支持的WWC架構是個啥(2)?
利用NVIDIA DPU重塑網(wǎng)絡安全格局
NVIDIA DOCA 3.0版本的亮點解析
基于NVIDIA BlueField DPU的5G UPF數(shù)據(jù)面加速方案
評論