chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

安謀科技:端側NPU技術創(chuàng)新,拉動AI算力落地引擎

晶芯觀察 ? 來源:電子發(fā)燒友網 ? 作者:黃晶晶 ? 2025-12-09 16:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網報道(文/黃晶晶)在日前舉行的2025集成電路發(fā)展論壇(成渝)暨三十一屆集成電路設計業(yè)展覽會(ICCAD-Expo2025)上,安謀科技產品總監(jiān)鮑敏祺接受行業(yè)媒體采訪,談及最新發(fā)布的周易X3 NPU IP以及生態(tài)建設、NPU發(fā)展趨勢等話題。


圖:安謀科技產品總監(jiān)鮑敏祺


周易X3 NPU IP正當時

安謀科技周易X3 NPU IP面向端側AI落地需求,基于專為大模型的DSP+DSA架構,協(xié)同AI軟件平臺,可應用于加速卡、智能座艙、具身智能、ADAS、AI PC等設備為其提供AI計算核芯。

該產品支持CNN與Transformer模型架構,單Cluster最高支持4核配置,可提供8~80 FP8TFLOPS靈活算力范圍。其單核帶寬達256GB/s,相較于上一代周易產品在同等工藝下FP16算力提升16倍,計算核心帶寬提升4倍,Softmax與LayerNorm性能提升超過10倍,多核算力線性度達70%~80%。

該產品具備多項核心技術優(yōu)勢,包括通用與專用計算單元深度融合的DSP+DSA架構;支持橫向擴展的多核設計與層級化內存互連方案;軟硬件協(xié)同優(yōu)化的任務調度機制;同時面向開發(fā)者提供開放的生態(tài)系統(tǒng),支持硬件自定義接口與軟件層面的算子擴展,增強平臺適配性與應用靈活性。

鮑敏祺表示,周易NPU的核心優(yōu)勢根植于研發(fā)階段對軟件生態(tài)的巨大投入,成熟的軟件體系與完善的生態(tài)布局,構成了其立足市場的核心競爭力。

在端側 AI 領域,當行業(yè)聚焦于同工藝下馮諾依曼架構相差無幾的面積與功耗指標時,周易NPU走出差異化路線。產品面向大模型重點強化了浮點支持能力。這并非簡單集成 FP8浮點等計算單元,更關鍵的是攻克特定精度下模型穩(wěn)定運行的量化相關技術難題。團隊融入 W4A16、W4A8等一系列計算范式,通過降低神經網絡模型的數(shù)值表達位寬來減少計算量、內存占用和功耗,同時盡量保持模型性能,從而讓浮點運算與大模型適配。

周易NPU 的推出時機,源于一年半前的產品定義與對市場趨勢的精準預判。彼時,端側 AI 的價值尚存在爭議,全球 AI 應用還普遍依賴云端算力。而當下,端側 AI 的發(fā)展必要性已然凸顯,這既順應行業(yè)風向,也契合國內市場的特殊需求。

從行業(yè)趨勢來看,今年3月起國際大廠紛紛轉向端側AI賽道,釋放出明確的技術信號。從國內市場來看,面臨著與國外不同的發(fā)展環(huán)境,例如在算力卡領域,國外已采用3 納米工藝,而由于工藝限制,國內大算力芯片(如 GPU)的單卡性能僅為國際先進水平的 1/5。

同時,中國龐大的用戶群體,也對算力供給提出更高要求。從前些年2T、4T 的算力需求,到如今 8T 乃至更高的算力訴求,市場對端側算力的需求持續(xù)攀升。以運行 Llama2 7B 模型為例,僅支撐 256token 的對話功能,算上50%利用率,理論上就需要 3.2TFLOPS 的算力,算力需求的增長可見一斑。正是基于對行業(yè)趨勢的深刻洞察,以及對客戶真實需求的精準把握,安謀科技認為當下正是周易NPU 推向市場的最佳時機。

生態(tài)伙伴協(xié)同

鮑敏祺表示,從生態(tài)上來看不同類型企業(yè)在AI 賽道的側重點各有不同。算法公司更關注如何通過高效的 AI 算法,在具體業(yè)務場景中創(chuàng)造效益、提升效率,底層的算力與芯片并非其關注的核心;SoC公司則聚焦快速go to market的目標,部分企業(yè)選擇自研算法,更多企業(yè)則傾向于挑選適配的 IP 來加速產品市場化進程。無論是算法公司的效率訴求,還是SoC公司的市場化需求,最終都指向IP高效交付與快速推向市場的核心能力,而這正是安謀科技踐行 AI Arm China 戰(zhàn)略的發(fā)力點。

從行業(yè)趨勢來看,AI 算法正逐步走向收斂。以往 CNN 等傳統(tǒng)模型遷移過程中,基于cuda編寫的算子往往面臨遷移難題。如今,無論是英偉達向上層 Python、應用層MaaS延伸,還是 OpenAI 等企業(yè)的技術推動,國內廠商都形成較高的適配統(tǒng)一性。大模型的運行門檻已大幅降低,僅需支持幾十個左右的算子即可實現(xiàn)大模型部署,所需計算量相較以往大幅減少。與此同時,行業(yè)也正經歷從GPGPU 向 ASIC AI 的轉型,博通等企業(yè)的快速發(fā)展印證了這一趨勢。專用架構能更好地突破GPGPU的能效天花板,實現(xiàn)更優(yōu)的能效與面積表現(xiàn)。

端側NPU技術趨勢

伴隨 AI 技術的深入演進,端側 NPU 的發(fā)展方向逐漸清晰,其未來趨勢將圍繞云邊端協(xié)同、通用性提升、專用算力強化三大核心展開,同時在物理工藝與算力功耗的限制下,探尋效率與靈活性的最優(yōu)解。
鮑敏祺談到,以機器人領域為例,云端負責統(tǒng)籌規(guī)劃,邊側承擔協(xié)調部署,端側聚焦執(zhí)行落地。在這一體系中,國外憑借先進算力優(yōu)勢,可通過持續(xù)堆疊硬件提升性能。國內則受限于工藝天花板,難以無限突破物理邊界,因此云邊端協(xié)同成為破局關鍵。

算力與功耗的限制,進一步框定端側 NPU 的發(fā)展邊界。在電池技術未出現(xiàn)革命性突破的前提下,短期之內端側 AI難以復刻云端的超大算力規(guī)模。因此,在有限算力范圍內,提升NPU的通用性與綜合能力,成為行業(yè)的核心發(fā)力點。

以安謀科技周易X3 NPU IP為代表,DSP+DSA 的組合架構已成為兼顧效率與靈活性的關鍵選擇。周易NPU已支持270余個公開模型,加上客戶定制模型更是達到 400 余個,端側 NPU的通用化已成為必然趨勢。未來,NPU不再局限于適配單一類型模型,而是要具備快速對接多元算法、滿足多場景需求的能力。

針對端側AI不同需求,NPU未來需在專用與通用之間找到平衡。如NPU需要強化Tensor 計算能力,通過增加 Tensor core與帶寬,提升專用算力的效率,但同時也需保留一定的通用 Vector core能力。

總體而言,端側 NPU 的未來發(fā)展,將是在云邊端協(xié)同的大框架下,以通用化適配海量模型,以專用算力保障運行效率,最終在有限的物理與功耗約束中,實現(xiàn)性能與靈活性的雙重提升。周易NPU從2018 年發(fā)展至今已迭代至第六代,最新一代重點面向大模型,未來還將不斷拔高端側NPU IP規(guī)格,持續(xù)迭代升級穩(wěn)步深耕。

端側AI時代已經到來,秉持AI Arm China這一發(fā)展戰(zhàn)略,安謀科技將聚焦AI技術,依托Arm生態(tài),全力服務于中國本土市場的創(chuàng)新。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    海光主板,3450G強加快數(shù)智技術創(chuàng)新

    數(shù)字經濟浪潮席卷全球,數(shù)智技術創(chuàng)新已成為驅動產業(yè)升級、推動社會進步的核心引擎,而力作為數(shù)智時代的“核心生產”,直接決定了數(shù)智創(chuàng)新的速度、
    的頭像 發(fā)表于 03-31 14:08 ?227次閱讀
    海光主板,3450G強<b class='flag-5'>算</b><b class='flag-5'>力</b>加快數(shù)智<b class='flag-5'>技術創(chuàng)新</b>

    邊緣AI臨界點:深度解析176TOPS香橙派AI Station的產業(yè)價值

    310P芯片的底層架構,深度剖析這款產品的技術細節(jié)、門檻及其在實際產業(yè)落地中的真實價值。 一、176TOPS的產業(yè)門檻:為何這是邊緣
    發(fā)表于 03-10 14:19

    廣和通MagiCore 2.0解決方案榮膺2025 AI玩具技術創(chuàng)新大獎

    12月23日,2025大灣區(qū)AI玩具產業(yè)創(chuàng)新發(fā)展大會在深圳舉行。廣和通現(xiàn)場展示了MagiCore 2.0輕AI陪伴解決方案及多款
    的頭像 發(fā)表于 12-30 14:59 ?565次閱讀

    應對AI、內存、功耗“三堵墻”困境,科技Arm China “周易”X3給出技術錦囊

    AI大模型正加速從云端向邊緣與滲透,然而,、內存、功耗等卻成了制約其規(guī)?;?b class='flag-5'>落地的“高墻”
    的頭像 發(fā)表于 12-18 13:45 ?511次閱讀
    應對<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>、內存、功耗“三堵墻”困境,<b class='flag-5'>安</b><b class='flag-5'>謀</b>科技Arm China “周易”X3給出<b class='flag-5'>技術</b>錦囊

    從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構計算效能

    的科技企業(yè)也在近期表示,將通過軟件層創(chuàng)新大幅提升資源利用率。作為高AI模組和
    的頭像 發(fā)表于 11-21 16:05 ?1284次閱讀
    從CPU、GPU到<b class='flag-5'>NPU</b>,美格智能持續(xù)優(yōu)化異構<b class='flag-5'>算</b><b class='flag-5'>力</b>計算效能

    架構//軟件/應用全面突破,科技Arm China用“周易”X3破局端AI

    高達39.6%。然而,當大模型從云端向滲透,瓶頸、能效矛盾、開發(fā)門檻成為制約
    的頭像 發(fā)表于 11-21 08:52 ?7937次閱讀
    架構/<b class='flag-5'>算</b><b class='flag-5'>力</b>/軟件/應用全面突破,<b class='flag-5'>安</b><b class='flag-5'>謀</b>科技Arm China用“周易”X3破局端<b class='flag-5'>側</b><b class='flag-5'>AI</b>

    發(fā)布“周易”X3 NPU,破局AI,智繪未來藍圖

    2025年11月13日,國內領先的芯片IP設計與服務提供商科技Arm China,正式揭開了新一代NPU IP“周易”X3的神秘面紗。通過其創(chuàng)新的專為大模型設計的DSP+DSA混合
    的頭像 發(fā)表于 11-17 11:47 ?412次閱讀
    <b class='flag-5'>安</b><b class='flag-5'>謀</b>發(fā)布“周易”X3 <b class='flag-5'>NPU</b>,破局<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>,智繪未來藍圖

    矢量計算性能提升200%,STAR-MC3賦能AI革命

    日益增長,推動芯片設計向更高能效、更強AI的方向演進。 ? 就在近期,芯片IP設計與服務提供商科技(Arm China)正式發(fā)布其自
    的頭像 發(fā)表于 10-27 09:11 ?2741次閱讀

    AI體驗躍遷,天璣9500用雙NPU開創(chuàng)AI新時代

    AI 正從“嘗鮮”邁向“常用”,下一代體驗該由誰定義?聯(lián)發(fā)科天璣9500給出答案:行業(yè)首發(fā)將 AI 4K 文生圖帶到手機,引領移動影像與創(chuàng)造
    的頭像 發(fā)表于 09-24 14:47 ?883次閱讀
    <b class='flag-5'>AI</b>體驗躍遷,天璣9500用雙<b class='flag-5'>NPU</b>開創(chuàng)<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>新時代

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領域,全力推動AI邊緣計算行業(yè)的深度發(fā)展。隨著AI技術的不斷
    的頭像 發(fā)表于 09-19 15:26 ?2030次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領域,全力推動AI邊緣計算行業(yè)的深度發(fā)展。隨著AI技術的不斷
    的頭像 發(fā)表于 09-19 15:25 ?1007次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    科技上線赤兔推理引擎服務,創(chuàng)新解鎖FP8大模型

    的模型輕量化部署方案。用戶通過遠程平臺預置的模型鏡像與AI工具,僅需50%的GPU即可解鎖大模型推理、企業(yè)知識庫搭建、智能體開發(fā),加
    的頭像 發(fā)表于 07-30 21:44 ?1021次閱讀

    AI需求大爆發(fā)!科技發(fā)布新一代NPU IP,賦能AI終端應用

    ,汽車自動駕駛的本地決策,都依賴提升,這對AI SoC的性能帶來挑戰(zhàn),上游IP廠商的新品可以給SoC廠商帶來最新助力。 7月9日,在
    的頭像 發(fā)表于 07-11 01:16 ?9012次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>需求大爆發(fā)!<b class='flag-5'>安</b><b class='flag-5'>謀</b>科技發(fā)布新一代<b class='flag-5'>NPU</b> IP,賦能<b class='flag-5'>AI</b>終端應用

    騰視科技TS-SG-SM7系列AI模組:32TOPS引擎,開啟邊緣智能新紀元

    從城市管理到工業(yè)生產,從物流運輸?shù)较M終端,TS-SG-SM7系列AI模組以 “超強、超低功耗、靈活擴展” 的特性,成為邊緣智能
    的頭像 發(fā)表于 07-07 16:44 ?2156次閱讀
    騰視科技TS-SG-SM7系列<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組:32TOPS<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>引擎</b>,開啟邊緣智能新紀元

    蘋芯科技 N300 存一體 NPU,開啟 AI 新征程

    隨著人工智能技術的爆發(fā)式增長,智能設備對本地與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構在數(shù)據(jù)處理效率上存在瓶頸,“內存墻”問題成為制
    的頭像 發(fā)表于 05-06 17:01 ?1292次閱讀
    蘋芯科技 N300 存<b class='flag-5'>算</b>一體 <b class='flag-5'>NPU</b>,開啟<b class='flag-5'>端</b><b class='flag-5'>側</b> <b class='flag-5'>AI</b> 新征程