chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Kleidi助力輕松加速AI工作負(fù)載

Arm社區(qū) ? 來源:Arm社區(qū) ? 2025-06-19 10:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

正如 Arm 工程部軟件高級副總裁 Mark Hambleton 在《2025 年芯片新思維》報告中所說:人工智能 (AI) 的未來發(fā)展離不開軟硬件的協(xié)同。

然而,在由 Arm 贊助的新 CIO 報告中所述,開發(fā)者工作流程的碎片化限制了開發(fā)者創(chuàng)建和擴(kuò)展新 AI 應(yīng)用的速度,而這也是目前其所面臨的最大挑戰(zhàn)之一。

Arm 深知軟件對于釋放 AI 的真正潛力至關(guān)重要,因而從基礎(chǔ)架構(gòu)和整個技術(shù)棧入手,致力于簡化 AI 開發(fā)流程,并支持新 AI 應(yīng)用和工作負(fù)載實(shí)現(xiàn)無縫性能加速。

基礎(chǔ)架構(gòu)

Arm 持續(xù)發(fā)展自身架構(gòu),作為軟硬件之間的重要接口。如今,從云端到邊緣側(cè)的廣泛市場中,Armv9 架構(gòu)已成為智能手機(jī)、數(shù)據(jù)中心、高性能計算和汽車應(yīng)用等領(lǐng)域的現(xiàn)代技術(shù)基礎(chǔ)。

Arm 不斷為最新的架構(gòu)引入新的功能,例如此前推出的可伸縮矩陣擴(kuò)展 (SME) 和可伸縮向量擴(kuò)展 (SVE2),有助于在各類應(yīng)用中加速生成式 AI 和常見機(jī)器學(xué)習(xí) (ML) 工作負(fù)載。SME 借由在通用指令集中引入復(fù)雜矩陣處理能力,使開發(fā)者能夠在其 AI 應(yīng)用中實(shí)現(xiàn)出眾性能,并無縫遷移到不同的生態(tài)系統(tǒng)。由此不僅擴(kuò)大了運(yùn)行 AI 工作負(fù)載的硬件范圍,還顯著提升了用戶體驗(yàn)。

CPU 對開發(fā)者的價值

上述架構(gòu)特性都集成到了 Arm 的 CPU 中,使之成為軟件開發(fā)者首選的目標(biāo)平臺。因?yàn)?Arm CPU 廣泛應(yīng)用于從云端到邊緣側(cè)的各種應(yīng)用,適合作為大多數(shù) AI 推理工作負(fù)載的直接目標(biāo)平臺,被廣泛應(yīng)用于數(shù)十億臺設(shè)備中,例如當(dāng)今的智能手機(jī),以及全球的云端和數(shù)據(jù)中心。通過選擇 Arm CPU 作為目標(biāo)平臺,開發(fā)者能夠以更多類型的數(shù)據(jù)格式運(yùn)行更廣泛的軟件,而無需為專用 NPU 開發(fā)多個版本的代碼。

CPU 為開發(fā)者提供了所需的一致性,避免了定制硬件解決方案所帶來的碎片化和效率低下。

正如 Hambleton 在《2025 年芯片新思維》報告中指出:AI 框架的互操作性是開發(fā)者的核心訴求。因此開發(fā)者通常默認(rèn)選擇 CPU 后端,因?yàn)?CPU 的普遍性確保了更廣泛的兼容性。

此外,推動 AI 工作負(fù)載擴(kuò)展的因素不僅限于架構(gòu)的進(jìn)步。

在 CIO 報告中,Arm 工程部機(jī)器學(xué)習(xí)工程副總裁 Nick Horne 表示,AI 已經(jīng)從依賴云端的龐大模型演變?yōu)榭稍谶吘墏?cè)或端側(cè)運(yùn)行的更小、更高效的模型。他指出:如今,有些出色的模型可在你隨身攜帶的設(shè)備上運(yùn)行并提供高質(zhì)量的結(jié)果,某些情況下甚至能夠完全在 CPU 上運(yùn)行。

對開源不變的承諾

Arm 與開源社區(qū)廣泛合作,致力于推動 AI 的普及,為開發(fā)者提供便捷途徑,使開發(fā)者能夠輕松獲取來自廣泛 Arm 生態(tài)系統(tǒng)合作伙伴的硬件,及時利用其中的最新架構(gòu)特性和性能。

Horne 在 CIO 報告中強(qiáng)調(diào)了這一方法為開發(fā)者帶來的優(yōu)勢。他指出:采用具有良好硬件抽象的開源 AI 框架,能夠顯著避免對靈活性的影響。

如此一來,開發(fā)者無需受限于特定硬件、云服務(wù)提供商或軟件平臺。

Kleidi 助力輕松加速 AI

Arm Kleidi 很好地體現(xiàn)了上述優(yōu)勢的實(shí)際應(yīng)用效果。Kleidi 提供開發(fā)者支持技術(shù)、資源和微內(nèi)核庫,能夠?yàn)樵?Arm CPU 上運(yùn)行的模型輕松實(shí)現(xiàn) AI 工作負(fù)載加速。由于 Kleidi 庫已集成到主流的開源 AI 框架和運(yùn)行時中,包括 Google 的 MediaPipe、Meta 的 ExecuTorch 和 PyTorch、llama.cpp,騰訊的 Angel,以及阿里巴巴的 MNN。開發(fā)者無需額外工作即可獲得性能優(yōu)化,從而節(jié)省時間、精力和成本。Kleidi 現(xiàn)已集成至 Arm 技術(shù)覆蓋的所有市場,包括移動端、云、數(shù)據(jù)中心、汽車和物聯(lián)網(wǎng)領(lǐng)域。

與行業(yè)領(lǐng)先的生態(tài)系統(tǒng)合作

從更廣泛的層面來看,Arm 通過行業(yè)領(lǐng)先的軟件生態(tài)系統(tǒng),與眾多合作伙伴開展協(xié)作,致力于安全、大規(guī)模地部署 AI。例如,Arm 與 GitHub 就 GitHub Runners 項目開展合作,使開發(fā)者能夠更高效地在云端測試和部署訓(xùn)練好的模型。近期,面向 GitHub CoPilot 的 Arm 擴(kuò)展程序?yàn)殚_發(fā)者提供了完全集成的原生 Arm 工作流,包括準(zhǔn)確的代碼生成、測試用例創(chuàng)建和錯誤修復(fù)功能。

此外,Arm 還通過各種舉措推動底層軟件和固件部署的簡化和加速,實(shí)現(xiàn)順暢的軟件開發(fā)。Linaro OneLab、Trusted Firmware 和 PSA Certified 等項目促進(jìn)了各方協(xié)作,并為快速發(fā)展的邊緣側(cè) AI 和高性能物聯(lián)網(wǎng)領(lǐng)域的安全軟件部署和支持提供了藍(lán)圖。在汽車行業(yè),Arm 發(fā)起的面向嵌入式邊緣的可擴(kuò)展開放架構(gòu) (SOAFEE) 致力于提供基于標(biāo)準(zhǔn)的框架,以實(shí)現(xiàn)軟件的規(guī)?;瘡?fù)用,從而縮短開發(fā)周期,滿足了軟件定義汽車 (SDV) 應(yīng)用中對更多 AI 的空前需求,同時提升了駕駛體驗(yàn)。

開放標(biāo)準(zhǔn)推動創(chuàng)新

最后,缺乏標(biāo)準(zhǔn)化實(shí)踐可能會阻礙創(chuàng)新,并可能在未來給開發(fā)者制造復(fù)雜難題。開放標(biāo)準(zhǔn)使開發(fā)者和研究人員可以在不同平臺之間無縫切換,同時專注于訓(xùn)練、量化和部署,通過模型的持續(xù)創(chuàng)新創(chuàng)造價值。

借助軟件加速 AI 創(chuàng)新

為了讓 AI 技術(shù)充分發(fā)揮潛力,軟件開發(fā)流程需要簡化、加速并開放。Arm 技術(shù)及其生態(tài)系統(tǒng)通過專注于開放標(biāo)準(zhǔn)、硬件抽象并與不斷演變的框架保持兼容,助力實(shí)現(xiàn)面向未來的 AI 開發(fā)。開發(fā)者因而能夠在不同硬件上無縫創(chuàng)建和部署 AI 應(yīng)用、模型和工作負(fù)載并提升性能,從而基于 Arm 平臺為 AI 時代打造更優(yōu)質(zhì)的軟件。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9583

    瀏覽量

    393487
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11320

    瀏覽量

    225832
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40941

    瀏覽量

    302517

原文標(biāo)題:選對運(yùn)用軟件的方法,使 AI 創(chuàng)新如虎添翼

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    Arm AGI CPU加速新一代基礎(chǔ)設(shè)施建設(shè)

    近期,Arm 推出 Arm AGI CPU,一款由 Arm 自主設(shè)計、面向人工智能 (AI) 數(shù)據(jù)中心的 CPU,旨在滿足日益增長的代理式 AI
    的頭像 發(fā)表于 04-09 15:55 ?273次閱讀

    使用NORDIC AI的好處

    ,時延更低,系統(tǒng)在網(wǎng)絡(luò)不穩(wěn)定甚至離線時也能繼續(xù)工作。[Edge AI 概述] 提升隱私與可靠性 原始傳感器數(shù)據(jù)(如運(yùn)動、生理信號等)可以留在本地,只上傳推理結(jié)果,有利于隱私與數(shù)據(jù)安全。 本地決策
    發(fā)表于 01-31 23:16

    Arm架構(gòu)助力Azure Cobalt 100虛擬機(jī)工作負(fù)載性能提升

    的 32 個地區(qū)上線,并且持續(xù)快速擴(kuò)展,為新一代數(shù)據(jù)中心工作負(fù)載帶來了性能、能效和可擴(kuò)展性的大幅提升。這些提升源于專為賦能現(xiàn)代云原生應(yīng)用設(shè)計的創(chuàng)新 Arm Neoverse 計算子系統(tǒng) (Compute Subsystems,
    的頭像 發(fā)表于 12-15 14:42 ?783次閱讀
    <b class='flag-5'>Arm</b>架構(gòu)<b class='flag-5'>助力</b>Azure Cobalt 100虛擬機(jī)<b class='flag-5'>工作</b><b class='flag-5'>負(fù)載</b>性能提升

    Arm Neoverse平臺集成NVIDIA NVLink Fusion

    生態(tài)系統(tǒng),實(shí)現(xiàn)全緩存一致性與高帶寬互連。 隨著 AI 數(shù)據(jù)中心對 Arm Neoverse 的需求持續(xù)增長,客戶在將工作負(fù)載加速器連接至
    的頭像 發(fā)表于 11-26 11:08 ?570次閱讀

    Arm Flexible Access方案引入Armv9邊緣AI計算平臺

    全球首個 Armv9 邊緣 AI 計算平臺(專為物聯(lián)網(wǎng)及邊緣 AI 工作負(fù)載優(yōu)化)將納入 Arm Flexible Access 方案,
    的頭像 發(fā)表于 10-29 15:27 ?1178次閱讀

    如何加速實(shí)時工作負(fù)載

    對于需要實(shí)時響應(yīng)的數(shù)據(jù)中心工作負(fù)載,性能不僅是指原始吞吐量或處理能力。挑戰(zhàn)在于:在保持吞吐量和能效的同時,實(shí)現(xiàn)確定性時延。
    的頭像 發(fā)表于 09-10 15:36 ?796次閱讀

    Arm Zena CSS加速軟件和芯片開發(fā)進(jìn)程

    Arm Zena CSS 能夠顯著縮短開發(fā)周期,使軟件團(tuán)隊能夠在物理硬件推出前就啟動開發(fā)工作,進(jìn)而助力車廠至少提前一年將新款車型推向市場。
    的頭像 發(fā)表于 08-25 16:22 ?2219次閱讀

    負(fù)載減少50%!ArmAI重新定義移動端圖形渲染

    是一項非常艱巨的任務(wù)。 ? Arm 終端事業(yè)部產(chǎn)品管理總監(jiān) Steve Steele 表示,Arm 始終專注于為市場提供高能效的計算能力,特別是針對當(dāng)下 AAA 手游中常見的高分辨率圖形工作負(fù)
    發(fā)表于 08-20 08:00 ?4154次閱讀
    <b class='flag-5'>負(fù)載</b>減少50%!<b class='flag-5'>Arm</b>用<b class='flag-5'>AI</b>重新定義移動端圖形渲染

    Arm神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經(jīng)加速器的技術(shù),移動設(shè)備上實(shí)現(xiàn)PC級別的AI圖形性能

    Arm 神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經(jīng)加速器的技術(shù),首次在移動設(shè)備上實(shí)現(xiàn) PC 級別的 AI 圖形性能,為未來的端側(cè) AI
    的頭像 發(fā)表于 08-14 17:59 ?2903次閱讀

    Arm率先適配騰訊混元開源模型,助力端側(cè)AI創(chuàng)新開發(fā)

    共同賦能端側(cè)人工智能 (AI) 部署,助力本土開發(fā)者實(shí)現(xiàn) AI 應(yīng)用創(chuàng)新! 這次的首日開源適配是雙方再次攜手提升端側(cè)應(yīng)用功能和用戶體驗(yàn)的又一例證。去年,Arm
    的頭像 發(fā)表于 08-08 09:16 ?1522次閱讀
    <b class='flag-5'>Arm</b>率先適配騰訊混元開源模型,<b class='flag-5'>助力</b>端側(cè)<b class='flag-5'>AI</b>創(chuàng)新開發(fā)

    Arm SME2 技術(shù)加速安卓 AI 升級,驅(qū)動移動應(yīng)用下一代功能革新

    。 隨著 AI 工作負(fù)載變得日益復(fù)雜且廣泛滲透至各個領(lǐng)域,移動開發(fā)者面臨的需求也與日俱增:他們需要在內(nèi)存、電力和熱預(yù)算等嚴(yán)格且多樣化的限制下,實(shí)現(xiàn)實(shí)時且高效的性能表現(xiàn),同時確保不會給應(yīng)用及其
    的頭像 發(fā)表于 07-18 20:28 ?1937次閱讀

    新思科技攜手微軟借助AI技術(shù)加速芯片設(shè)計

    近日,微軟Build大會在西雅圖盛大開幕,聚焦AI加速各行業(yè)(包括芯片設(shè)計行業(yè))科學(xué)突破方面的變革潛力。作為Microsoft Discovery平臺發(fā)布的啟動合作伙伴,新思科技亮相本次大會,并攜手微軟將AI融入芯片設(shè)計,開發(fā)
    的頭像 發(fā)表于 06-27 10:23 ?1253次閱讀

    通過NVIDIA RTX PRO服務(wù)器加速企業(yè)工作負(fù)載

    從大語言模型(LLM)到代理式 AI 推理和物理 AI ,隨著 AI 工作負(fù)載的復(fù)雜性和規(guī)模不斷增加,人們對更快、擴(kuò)展性更高的計算基礎(chǔ)設(shè)施的
    的頭像 發(fā)表于 06-12 15:31 ?1085次閱讀
    通過NVIDIA RTX PRO服務(wù)器<b class='flag-5'>加速</b>企業(yè)<b class='flag-5'>工作</b><b class='flag-5'>負(fù)載</b>

    Arm計算平臺助力汽車行業(yè)轉(zhuǎn)型

    人工智能 (AI) 正在深度變革汽車行業(yè),從車輛設(shè)計、制造到功能實(shí)現(xiàn)均迎來突破。這一趨勢與全球各行業(yè)加速擁抱 AI 的背景高度契合,根據(jù) Arm 發(fā)布的《人工智能就緒指數(shù)報告》,全球
    的頭像 發(fā)表于 05-28 14:19 ?1139次閱讀

    Arm與微軟合作加速邊緣設(shè)備上的AI體驗(yàn)

    隨著人工智能 (AI) 成為當(dāng)今個人電腦 (PC) 和移動設(shè)備使用體驗(yàn)(從聊天機(jī)器人到生產(chǎn)力提升)中不可或缺的一部分,這些設(shè)備對 CPU 高效、可擴(kuò)展的推理需求也在持續(xù)增長。Arm 與微軟正攜手合作
    的頭像 發(fā)表于 05-28 13:54 ?916次閱讀