chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于Arm架構(gòu)的NVIDIA DGX Spark平臺構(gòu)建離線語音助手系統(tǒng)

Arm社區(qū) ? 來源:Arm社區(qū) ? 2026-04-09 15:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 首席解決方案架構(gòu)師 沈綸銘

基于云的人工智能 (AI) 占據(jù)了大多數(shù)關(guān)注焦點,但真正實現(xiàn)響應和隱私保護的交互則發(fā)生在邊緣側(cè)。本文將展示如何基于 Arm 架構(gòu)的 NVIDIA DGX Spark 平臺,構(gòu)建一個完全離線、實時運行的語音助手系統(tǒng)。該系統(tǒng)集成了諸如 faster-whisper 和 vLLM 等開源組件,在無需將數(shù)據(jù)發(fā)送到本地環(huán)境之外的情況下,實現(xiàn)低延遲、接近人類對話體驗的交互。

技術(shù)挑戰(zhàn)

對云的依賴困境

在許多企業(yè)環(huán)境中,技術(shù)人員需要快速訪問內(nèi)部文檔或獲得實時支持。然而,依賴云端 API 會帶來三個關(guān)鍵瓶頸:

延遲:與云端 API 的往返通信會打斷語音對話的自然節(jié)奏。

隱私:將敏感數(shù)據(jù)發(fā)送到外部服務器會帶來合規(guī)風險,尤其是在涉及專有內(nèi)容時。

成本與可控性:基于 API 的計費模式和使用限制,會限制系統(tǒng)的擴展能力以及針對特定行業(yè)需求的定制化能力。

解決方案

異構(gòu)的開源流水線

為了應對上述問題,我們在 DGX Spark 上設計了一套流水線,DGX Spark 基于 NVIDIA GB10 Grace Blackwell 構(gòu)建。在該方案中,CPU 被定位一個主動的、以低延遲為優(yōu)化目標的計算引擎。

軟件棧

為了實現(xiàn)最大的靈活性與性能,整個系統(tǒng)運行在以下開源工具上:

09805778-3268-11f1-90a1-92fbcf53809c.png

關(guān)鍵組件與系統(tǒng)設計

實時音頻與語音活動檢測

系統(tǒng)以 16kHz 單聲道音頻進行采集,并使用 WebRTC 的語音活動檢測 (VAD) 在 30 毫秒的幀級別上檢測語音信號。該方法能夠確保系統(tǒng)只處理有效的語音輸入,同時忽略背景噪聲和靜音間隔。

基于 Arm 架構(gòu) CPU 的高速語音轉(zhuǎn)寫

對于短時、對延遲敏感的任務,系統(tǒng)并未將其分流到 GPU 上,而是使用高性能的 Arm CPU 集群(Arm Cortex-X 和 Cortex-A 系列核心)來處理。

為什么選擇 Arm:Arm 架構(gòu)針對實時搜索、小批量推理任務等延遲關(guān)鍵型工作負載進行了優(yōu)化,

性能表現(xiàn):在 Arm CPU 上運行 faster-whisper 可以滿足低延遲需求,在交互式系統(tǒng)中,語音轉(zhuǎn)寫時間約為 70 至 90 毫秒。

基于 GPU 加速的推理 (vLLM)

在完成語音轉(zhuǎn)寫后,文本會被傳遞至 vLLM 進行處理。DGX Spark 采用統(tǒng)一內(nèi)存 (Unified Memory),使 CPU 與 GPU 共享同一內(nèi)存空間。該設計允許 GPU 直接訪問 CPU 的輸出數(shù)據(jù),從而無需顯式的數(shù)據(jù)傳輸或消除通過 PCIe 進行拷貝所帶來的額外開銷。

系統(tǒng)架構(gòu)流程圖

以下流程圖展示了在 DGX Spark 上構(gòu)建的一個高性能異構(gòu)流水線。系統(tǒng)將任務分配給最合適的計算單元,以降低整體延遲。

09ef7a22-3268-11f1-90a1-92fbcf53809c.png

圖:DGX Spark 異構(gòu)流水線。Arm CPU 負責 STT 轉(zhuǎn)錄,

GPU 負責生成響應,從而顯著降低交互延遲。

在該流水線中,Cortex-X 和 Cortex-A CPU 核心用于處理對延遲敏感的任務,例如音頻采集和語音轉(zhuǎn)寫。這種方式可以實現(xiàn)低于 100 毫秒的響應時間。系統(tǒng)采用統(tǒng)一內(nèi)存,使 GPU 能夠直接訪問共享 DRAM 中的轉(zhuǎn)寫數(shù)據(jù),從而消除了傳統(tǒng) PCIe 數(shù)據(jù)傳輸帶來的開銷。整個流程的最后,由 NVIDIA GPU 運行 vLLM 引擎生成智能響應,從而實現(xiàn)高吞吐量且具備隱私保護的對話體驗。

演示:

本地語音交互與性能指標

我們通過一個多輪“訂閱取消”場景對系統(tǒng)進行了驗證。系統(tǒng)能夠生成經(jīng)過驗證、基于事實的回答,并且未出現(xiàn)幻覺 (hallucination) 問題。

性能指標:延遲拆解

以下數(shù)據(jù)記錄了從用戶語音結(jié)束到大語音模型開始生成響應之間的精確時間(即響應延遲)。

0a518e60-3268-11f1-90a1-92fbcf53809c.png

觀察結(jié)果:所有對話輪次的平均響應延遲約為四秒。該性能表現(xiàn)可與基于云的解決方案相媲美,同時在無需網(wǎng)絡連接的情況下提供了更強的隱私保護。

構(gòu)建你自己的系統(tǒng)?

理解 Arm 架構(gòu) AI 能力的最佳方式是親自實踐。為此,我們準備了一套完整的、循序漸進的 Learning Path,幫助你部署這一流水線??靵韯邮謱嵺`吧!

該 Learning Path 將指導以下內(nèi)容:

如何為邊緣設備配置專業(yè)級麥克風采集系統(tǒng);

如何針對 Arm Cortex-X 優(yōu)化 faster-whisper;

如何使用量化模型部署 vLLM,以最大化本地吞吐性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9582

    瀏覽量

    393429
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5682

    瀏覽量

    110086
  • 語音助手
    +關(guān)注

    關(guān)注

    7

    文章

    243

    瀏覽量

    27642

原文標題:在邊緣側(cè)重新思考語音 AI:基于 Arm 架構(gòu)的 DGX Spark 的實用離線流水線

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA DGX Spark平臺上對NVIDIA ConnectX-7 200G網(wǎng)卡配置教程

    NVIDIA DGX Spark 平臺上對 NVIDIA ConnectX-7 200G 網(wǎng)卡進行配置時,會遇到“4 個邏輯端口”現(xiàn)象。
    的頭像 發(fā)表于 11-21 09:19 ?5958次閱讀
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b><b class='flag-5'>平臺</b>上對<b class='flag-5'>NVIDIA</b> ConnectX-7 200G網(wǎng)卡配置教程

    NVIDIA DGX Spark系統(tǒng)恢復過程與步驟

    在使用 NVIDIA DGX Spark 的過程中,可能會出現(xiàn)配置故障,而導致開發(fā)中斷的問題,本篇教程將帶大家了解如何一步步完成系統(tǒng)恢復。
    的頭像 發(fā)表于 11-28 09:46 ?5854次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b><b class='flag-5'>系統(tǒng)</b>恢復過程與步驟

    NVIDIA DGX Spark快速入門指南

    NVIDIA DGX Spark 已正式向 AI 開發(fā)者交付,對于剛?cè)胧值娜?DGX Spark,該如何進行初始化設置?本篇文章將引導您完
    的頭像 發(fā)表于 11-17 14:11 ?6942次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>快速入門指南

    Microchip發(fā)布專為NVIDIA DGX Spark而設計的MEC1723嵌入式控制器定制固件

    DGX Spark個人AI超級計算機定制設計的 MEC1723嵌入式控制器(EC)固件 ,進一步優(yōu)化MEC1723 EC在NVIDIA DGX平臺
    的頭像 發(fā)表于 01-15 18:51 ?6.6w次閱讀
    Microchip發(fā)布專為<b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>而設計的MEC1723嵌入式控制器定制固件

    NVIDIA 宣布推出 DGX Spark 個人 AI 計算機

    臺式超級計算機由 NVIDIA Grace Blackwell 驅(qū)動,為開發(fā)者、研究人員和數(shù)據(jù)科學家提供加速 AI 功能;系統(tǒng)由頭部計算機制造商(包括華碩、Dell Technologies、HP
    發(fā)表于 03-19 09:59 ?865次閱讀
       <b class='flag-5'>NVIDIA</b> 宣布推出 <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b> 個人 AI 計算機

    NVIDIA GTC2025 亮點 NVIDIA推出 DGX Spark個人AI計算機

    和聯(lián)想)提供。 NVIDIA 發(fā)布了由 NVIDIA Grace Blackwell 平臺驅(qū)動的 DGX 個人 AI 超級計算機。 DGX
    的頭像 發(fā)表于 03-20 18:59 ?1766次閱讀
    <b class='flag-5'>NVIDIA</b> GTC2025 亮點  <b class='flag-5'>NVIDIA</b>推出 <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>個人AI計算機

    NVIDIA發(fā)布AI優(yōu)先DGX個人計算系統(tǒng)

    NVIDIA 宣布,多家行業(yè)領(lǐng)先系統(tǒng)制造商將打造 NVIDIA DGX Spark。
    的頭像 發(fā)表于 05-22 09:39 ?1234次閱讀

    NVIDIA DGX Spark桌面AI計算機開啟預訂

    DGX Spark 現(xiàn)已開啟預訂!麗臺科技作為 NVIDIA 授權(quán)分銷商,提供從產(chǎn)品到服務的一站式解決方案,助力輕松部署桌面 AI 計算機。
    的頭像 發(fā)表于 09-23 17:20 ?1496次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>桌面AI計算機開啟預訂

    NVIDIA DGX Spark新一代AI超級計算機正式交付

    NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在 SpaceX 向埃隆·馬斯克交付 DGX Spark。
    的頭像 發(fā)表于 10-21 10:41 ?1427次閱讀

    NVIDIA DGX Spark助力構(gòu)建自己的AI模型

    2025 年 1 月 6 日,NVIDIA 正式宣布其 Project DIGITS 項目,并于 3 月 18 日更名為 NVIDIA DGX Spark,進一步公布了產(chǎn)品細節(jié)。
    的頭像 發(fā)表于 11-21 09:25 ?1477次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>助力<b class='flag-5'>構(gòu)建</b>自己的AI模型

    如何在DGX Spark上運行NVIDIA Omniverse

    首先感謝 Vigor 同學第一時間的分享,以下是具體如何在 DGX Spark 上運行 Omniverse 的方法。
    的頭像 發(fā)表于 12-17 10:13 ?887次閱讀
    如何在<b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>上運行<b class='flag-5'>NVIDIA</b> Omniverse

    NVIDIA DGX Spark桌面級AI超級計算機助力開發(fā)者構(gòu)建AI模型

    開源 AI 正在加速各行各業(yè)的創(chuàng)新,NVIDIA DGX Spark 將幫助開發(fā)者將創(chuàng)新轉(zhuǎn)化為影響力。
    的頭像 發(fā)表于 01-09 09:49 ?659次閱讀

    全新軟件與模型優(yōu)化為NVIDIA DGX Spark注入強大動力

    自發(fā)布以來,NVIDIA 通過持續(xù)的軟件優(yōu)化以及與軟件合作伙伴和開源社區(qū)的緊密協(xié)作,不斷提升基于 Grace Blackwell 架構(gòu)DGX Spark 的性能。這些舉措在推理、訓
    的頭像 發(fā)表于 01-09 10:17 ?811次閱讀

    NVIDIA DGX Spark助力高等教育領(lǐng)域重大項目

    在全球各地的頂尖高校,NVIDIA DGX Spark 桌面超級計算機正將數(shù)據(jù)中心級的 AI 能力帶到實驗室臺前、教師辦公室里和學生的終端設備上。在地球最南端的南極,也有一臺 DGX
    的頭像 發(fā)表于 03-09 16:33 ?643次閱讀

    首屆中國NVIDIA DGX Spark黑客松大賽開啟報名

    NVIDIA 前沿技術(shù)生態(tài),聚焦 DGX Spark 平臺的全棧開發(fā)能力,以代碼為刃,以算力為鋒,共同探索 DGX
    的頭像 發(fā)表于 03-14 16:39 ?2690次閱讀