chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Say Hi to ERNIE!Imagination GPU率先完成文心大模型的端側(cè)部署

穎脈Imgtec ? 2025-07-01 08:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Imagination Technologies 宣布率先完成百度文心大模型(ERNIE 4.5 開源版)在其 GPU 硬件上的端側(cè)部署。適配完成后,開發(fā)者可在搭載 Imagination GPU 的設(shè)備上實現(xiàn)高效本地 AI 推理,同時大幅降低推理成本,這一成果也標(biāo)志著 Imagination GPU 在端側(cè) AI 推理場景中的技術(shù)領(lǐng)先性。


Imagination高度優(yōu)化軟件棧實現(xiàn)高效本地AI推理、降低成本

本次適配的文心4.5模型為開源版本,具備強大的智能問答、文本生成、語義理解和知識推理能力,廣泛適用于移動設(shè)備、語音助手、IoT和教育硬件等資源受限終端。在飛槳框架支持下,Imagination GPU平臺展現(xiàn)出出色的推理性能。

Imagination基于現(xiàn)有的GPU硬件順利完成了本次文心大模型系列開源模型部署軟件棧,并得到實際網(wǎng)絡(luò)驗證。同時,Imagination高度優(yōu)化的計算軟件棧對AI本地推理性能進行優(yōu)化,該軟件棧包含OpenCL計算庫,編譯器工具鏈,主流編程框架的參考開發(fā)套件(Reference Kits)。

其中參考開發(fā)套件可協(xié)助開發(fā)者通過TVM將主流AI框架中的代碼遷移至Imagination的軟件棧。該套件基于Imagination優(yōu)化的OpenCL計算庫和圖編譯器,使用專屬API調(diào)用,提供全面的文檔說明和組件集成參考,便于客戶將其高效融入自身開發(fā)流程。


Imagination與百度協(xié)同創(chuàng)新,加速大模型端側(cè)普及

適配過程中,Imagination與百度團隊緊密合作,針對文心4.5的特點進行了優(yōu)化。推理方面,百度文心提出了多專家并行協(xié)同量化方法和卷積編碼量化算法,實現(xiàn)了效果接近無損的4-bit量化和2-bit量化。此外,還實現(xiàn)了動態(tài)角色轉(zhuǎn)換的預(yù)填充、解碼分離部署技術(shù),可以更充分地利用資源,提升文心4.5 MoE模型的推理性能。基于飛槳框架,文心4.5在Imagination GPU硬件平臺上表現(xiàn)出優(yōu)異的推理性能。

Imagination在今年5月推出了面向邊緣AI的E 系列 GPU,具備高性能、低功耗和靈活可編程的特點,適用于自然語言處理、工業(yè)計算機視覺、自動駕駛等應(yīng)用。此次與文心模型的成功適配,也為未來客戶在采用E系列GPU構(gòu)建本地AI應(yīng)用奠定了堅實基礎(chǔ)。

早在此前,Imagination加由入百度飛槳發(fā)起的 “硬件生態(tài)共創(chuàng)計劃”,將飛槳的先進算法和靈活性與 Imagination IP 技術(shù)相結(jié)合,為端側(cè)開發(fā)者提供強大支持。隨著邊緣計算需求的快速增長,Imagination將繼續(xù)與百度深入合作,推動大模型在端側(cè)設(shè)備的普及與落地,共同打造更高效、智能的本地AI體驗。

bc3ad94a-5610-11f0-986f-92fbcf53809c.jpg

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5258

    瀏覽量

    136037
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40908

    瀏覽量

    302498
  • imagination
    +關(guān)注

    關(guān)注

    1

    文章

    623

    瀏覽量

    63481
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3746

    瀏覽量

    5268
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    沐曦股份曦云C系列GPU產(chǎn)品Day 0適配百度文ERNIE-Image文生圖模型

    4月15日,百度文模型團隊重磅推出ERNIE?Image文生圖模型,沐曦股份曦云 C 系列 GPU
    的頭像 發(fā)表于 04-15 17:39 ?386次閱讀

    海光DCU Day0適配百度文ERNIE-Image文生圖模型

      今天,百度文模型團隊發(fā)布ERNIE-Image文生圖模型,海光DCU同步完成Day0適配與深度調(diào)優(yōu)。全球開發(fā)者、科研機構(gòu)和企業(yè)現(xiàn)可免
    的頭像 發(fā)表于 04-15 15:47 ?133次閱讀

    Day-0支持|摩爾線程率先完成MiniMax M2.7大模型適配

    4月12日,摩爾線程旗艦級AI訓(xùn)推一體全功能GPU?MTT S5000已完成對新一代大模型MiniMax M2.7的Day-0極速適配,再次驗證了國產(chǎn)全功能GPU對前沿AI大
    發(fā)表于 04-13 07:57 ?1051次閱讀
    Day-0支持|摩爾線程<b class='flag-5'>率先</b><b class='flag-5'>完成</b>MiniMax M2.7大<b class='flag-5'>模型</b>適配

    天數(shù)智芯完成阿里云通義千問Qwen3.5系列多模態(tài)模型全量適配

    近日,天數(shù)智芯攜手眾智FlagOS 社區(qū)完成阿里云通義千問 Qwen3.5 系列多模態(tài)模型全量適配,實現(xiàn)模型精度精準(zhǔn)對齊與無縫
    的頭像 發(fā)表于 03-26 09:25 ?1351次閱讀

    AI側(cè)部署案例(SC171開發(fā)套件V2-FAS)

    AI側(cè)部署案例(SC171開發(fā)套件V2-FAS) 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 初學(xué)者入門手寫數(shù)字識別案例 32分21秒 https
    發(fā)表于 02-11 12:08

    AI側(cè)部署開發(fā)(SC171開發(fā)套件V2-FAS)

    AI側(cè)部署開發(fā)(SC171開發(fā)套件V2-FAS) 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南 27分19秒 https
    發(fā)表于 02-11 11:44

    AI側(cè)部署案例(SC171開發(fā)套件V3)2026版

    AI側(cè)部署案例(SC171開發(fā)套件V3)2026版 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 初學(xué)者入門手寫數(shù)字識別案例 25分29秒 https
    發(fā)表于 01-15 10:40

    AI側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版

    AI側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南 27分19秒 https
    發(fā)表于 01-15 10:31

    百度文模型5.0 Preview榮登LMArena文本榜國內(nèi)第一

    12月23日,LMArena大模型競技場發(fā)布最新排名,文模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名國內(nèi)第一該
    的頭像 發(fā)表于 12-23 15:02 ?654次閱讀

    百度文模型5.0-Preview文本能力國內(nèi)第一

    11月8日凌晨,LMArena大模型競技場最新排名顯示,文全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中國第一該
    的頭像 發(fā)表于 11-11 17:15 ?1628次閱讀

    基于Vulkan的側(cè)AI運算

    本期內(nèi)容由AI Model SIG提供,介紹了在開源鴻蒙中,利用圖形接口Vulkan的計算著色器能力,在側(cè)部署模型的的整體思路和實踐分享。
    的頭像 發(fā)表于 09-10 17:19 ?1639次閱讀
    基于Vulkan的<b class='flag-5'>端</b>側(cè)AI運算

    【VisionFive 2單板計算機試用體驗】3、開源大語言模型部署

    , Gemma等開源大模型。當(dāng)然,一些閉源的(類似chatgpt, gemini)是不支持部署的。如下圖: 在側(cè)部署模型,個人認(rèn)為最大
    發(fā)表于 07-19 15:45

    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)

    的深度融合展開合作。雙方將結(jié)合 Imagination 領(lǐng)先的 GPU IP 技術(shù)與澎峰科技在 AI 模型壓縮與性能優(yōu)化方面的軟硬協(xié)同能力,共同開拓面向 AI 行業(yè)應(yīng)用的計算解決方案,推動國產(chǎn)計算生態(tài)
    發(fā)表于 05-21 09:40 ?1287次閱讀

    MediaTek天璣9400率先完成阿里Qwen3模型部署

    通義大模型團隊在天璣 9400 旗艦移動平臺上率先完成 Qwen3(千問 3)的側(cè)部署。未來,搭載天璣 9400 移動平臺的設(shè)備可充分發(fā)揮
    的頭像 發(fā)表于 05-08 10:11 ?1469次閱讀

    摩爾線程GPU率先支持Qwen3全系列模型

    近日,阿里云正式發(fā)布Qwen3系列的8款開源混合推理模型。摩爾線程團隊在模型發(fā)布當(dāng)天,率先完成了Qwen3全系列模型在全功能
    的頭像 發(fā)表于 05-07 15:24 ?1118次閱讀