chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GAITC2025|張科:端云一體大模型推理應用實戰(zhàn)

京東云 ? 來源:jf_75140285 ? 作者:jf_75140285 ? 2025-06-26 09:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期,2025全球人工智能技術(shù)大會(GAITC2025)于杭州盛大開幕,匯聚全球頂尖科學家、技術(shù)領(lǐng)袖及行業(yè)先鋒,共同探討人工智能技術(shù)產(chǎn)業(yè)化新趨勢。京東零售AI Infra &大數(shù)據(jù)計算負責人張科受邀出席并在《行業(yè)大模型應用與發(fā)展》論壇發(fā)表演講,首次深入介紹京東零售在端云一體大模型推理架構(gòu)的實戰(zhàn)經(jīng)驗與技術(shù)探索,并分享AI推理方向的未來發(fā)展思考。以下為張科分享實錄,內(nèi)容經(jīng)編輯略有刪減:

電商場景AI推理的挑戰(zhàn)

大模型技術(shù)突飛猛進,大模型不僅是算法和算力的集合體,更是產(chǎn)業(yè)智能化的新底座,正在推動AI從“可用”向“好用、可控、可信”邁進。電商場景作為AI技術(shù)的應用場,逐步形成了三個主要的需求方向:

Generative AI

(如AI生成商品圖、短視頻、AI營銷內(nèi)容生成、AI數(shù)字人)、

Agentic AI

(如AI客服與售后管理、AI經(jīng)營托管、AI倉配優(yōu)化 、AI交互式推薦)、

Physical AI

(如自動分揀機器人、智能空間、自動駕駛)。在復雜場景與多元需求的驅(qū)動下,AI推理正面臨一系列技術(shù)挑戰(zhàn),包括輸入類型多樣、用戶需求優(yōu)先級不同;端(如手機)和云(服務器)之間任務分配難、協(xié)同優(yōu)化難;模型壓縮和性能優(yōu)化等問題。

京東零售聯(lián)合清華大學推出 xLLM 端云一體大模型推理架構(gòu)

2022年起,京東與清華大學開啟深度合作,在計算機視覺機器學習、推薦系統(tǒng)、大數(shù)據(jù)等領(lǐng)域聯(lián)合開展了十余項課題研究。今年雙方進一步拓展合作邊界,新增

大模型推理引擎國產(chǎn)化、多模態(tài)推薦大模型

等前沿方向,聚焦整合技術(shù)資源與學術(shù)優(yōu)勢,共同探索前沿技術(shù)創(chuàng)新,推動科研成果向?qū)嶋H生產(chǎn)力轉(zhuǎn)化。自今年初大模型推理引擎國產(chǎn)化合作開展以來,京東零售和清華大學一起在大模型量化壓縮、端-云協(xié)同推理引擎等方向聯(lián)合攻堅,并提出“xLLM 端云一體大模型推理架構(gòu)”,以解決推理引擎的性能優(yōu)化問題、助力大模型技術(shù)在復雜電商環(huán)境的規(guī)?;涞?。通過端云聯(lián)合部署,實現(xiàn)高效協(xié)同推理。利用終端用戶數(shù)據(jù)和反饋,云端模型持續(xù)優(yōu)化并實時更新終端輕量化模型,形成閉環(huán)進化系統(tǒng),提高模型在實際場景中的性能。該架構(gòu)還可適應不同終端設備資源限制,實現(xiàn)大模型更廣泛復用。

xLLM端云一體大模型推理架構(gòu)中的技術(shù)探索還表現(xiàn)在以下4個方面:

1.自適應調(diào)度優(yōu)化:

動態(tài)調(diào)整Prefill與Decode節(jié)點比例,實現(xiàn)動態(tài)的自適應彈性PD能力。

2.在離線統(tǒng)一調(diào)度:

根據(jù)負載實時調(diào)度在離線請求,實現(xiàn)請求級別的在離線混部的能力。

3.多層流水線執(zhí)行:

最大化資源利用率,通過調(diào)度和模型執(zhí)行異步流水線、不同Layer的計算和通信異步流水線、不同計算單元、訪存并行流水線的多層流水線執(zhí)行。

4.端云Agent協(xié)同:

端Agent處理簡單任務與隱私數(shù)據(jù),云 Agent 不斷反饋優(yōu)化,提升端 Agent 能力,并基于高效 Agent 協(xié)議協(xié)同。目前該推理架構(gòu)已經(jīng)在內(nèi)部多個場景應用,在可交互式導購、商品對比、商品總結(jié)、購物建議等環(huán)節(jié),大幅提升了響應速度,節(jié)省了計算成本,同時還有效助力了用戶的活躍度。在核心的商品理解環(huán)節(jié),也有效提升了大模型的理解能力和信息處理能力,模型推理成本最高可節(jié)省70%。

AI推理方向的未來思考

在現(xiàn)有技術(shù)探索的基礎(chǔ)上,未來京東還將持續(xù)加大對國產(chǎn) AI 基礎(chǔ)設施的投入力度,著力構(gòu)筑自主可控的技術(shù)生態(tài)體系。京東將重點聚焦三大前沿方向展開深入研究:

破解規(guī)模、效率、成本的 “不可能三角”、推進(端云)多智能體異步自進化、端云分布式推理的可解釋和可調(diào)試

。通過上述布局,京東希望逐步實現(xiàn)主流國產(chǎn)芯片的深度適配優(yōu)化,并基于自主研發(fā)的大模型推理框架,推動技術(shù)效率達到國際先進水平。也希望和業(yè)界同行共探技術(shù)邊界、一起前行。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40908

    瀏覽量

    302486
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50284

    瀏覽量

    266784
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3746

    瀏覽量

    5266
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    廣汽集團發(fā)布星河智艙ADiGO Intelligence一體架構(gòu)

    2026廣汽科技日,廣汽集團集中發(fā)布全新星源動力、星艦車身、星河智艙、星靈架構(gòu)及芯片生態(tài)領(lǐng)域最新成果。其中,廣汽集團智能座艙產(chǎn)品線總裁朱太平帶來了星河智艙ADiGO Intelligence一體架構(gòu),讓智能出行“更懂你”。
    的頭像 發(fā)表于 04-16 15:07 ?211次閱讀

    九天菜菜大模型agent智能開發(fā)實戰(zhàn)2026月班

    順應了這一科技發(fā)展趨勢。課程匯聚了行業(yè)內(nèi)頂尖專家和資深開發(fā)者,他們將通過豐富的案例和實戰(zhàn)項目,深入淺出地講解大模型 Agent 的開發(fā)原理、技術(shù)架構(gòu)和實際應用。學員們將有機會親自動手實踐,從需求分析
    發(fā)表于 04-15 16:04

    觸拓(CHUTO)戶外廣告一體機,無懼酷暑全天候在線# 觸拓 #戶外觸摸一體

    一體
    深圳市觸拓科技有限公司
    發(fā)布于 :2026年04月08日 12:20:40

    2025夏季班正課】大模型Agent智能開發(fā)實戰(zhàn) 課分享

    2025年12月班】大模型與Agent智能開發(fā)實戰(zhàn)] 拒絕碎片化:體系化學 Agent 開發(fā)方法的技術(shù)深度剖析 在當今的人工智能應用開發(fā)領(lǐng)域,
    發(fā)表于 03-29 16:12

    中科創(chuàng)達攜手亞馬遜科技推出一體化邊緣AI解決方案

    作為全球領(lǐng)先的智能操作系統(tǒng)和側(cè)智能技術(shù)提供商,中科創(chuàng)達始終致力于通過技術(shù)創(chuàng)新賦能產(chǎn)業(yè)升級。2026年1月8日, 中科創(chuàng)達(ThunderSoft)在拉斯維加斯CES現(xiàn)場發(fā)表演講,并攜手亞馬遜科技聯(lián)合發(fā)布
    的頭像 發(fā)表于 01-14 10:00 ?2227次閱讀

    華為舉辦數(shù)字政府應急行業(yè)小安大模型一體機推介會

    2025年9月18日,以“躍升行業(yè)智能化”為主題的華為全聯(lián)接大會2025在上海舉辦。期間,華為公司舉辦了數(shù)字政府應急行業(yè)“小安大模型一體機”推介會,北京安信創(chuàng)業(yè)信息科技發(fā)展有限公司總工
    的頭像 發(fā)表于 09-20 14:49 ?1614次閱讀

    解決方案 | 一體化OTA HIL測試解決方案

    TOSUN一體化OTAHIL測試解決方案隨著智能網(wǎng)聯(lián)汽車的快速發(fā)展,OTA(Over-the-Air)技術(shù)已成為車輛軟件升級的核心手段。為滿足日益嚴格的法規(guī)要求和技術(shù)挑戰(zhàn),同星智能(TOSUN
    的頭像 發(fā)表于 09-19 20:03 ?1797次閱讀
    解決方案 | <b class='flag-5'>云</b>管<b class='flag-5'>端</b><b class='flag-5'>一體</b>化OTA HIL測試解決方案

    迅為RK3568開發(fā)板模型推理測試實戰(zhàn)LPRNet?車牌識別

    迅為RK3568開發(fā)板模型推理測試實戰(zhàn)LPRNet 車牌識別
    的頭像 發(fā)表于 08-25 14:55 ?1527次閱讀
    迅為RK3568開發(fā)板<b class='flag-5'>模型</b><b class='flag-5'>推理</b>測試<b class='flag-5'>實戰(zhàn)</b>LPRNet?車牌識別

    華為亮相2025金融AI推理應用落地與發(fā)展論壇

    近日,2025金融AI推理應用落地與發(fā)展論壇在上海舉行。中國銀聯(lián)執(zhí)行副總裁涂曉軍、華為數(shù)字金融軍團CEO曹沖出席本次論壇并發(fā)表致辭。論壇上,華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰博士發(fā)布AI推理
    的頭像 發(fā)表于 08-15 09:45 ?1368次閱讀

    利用NVIDIA推理模型構(gòu)建AI智能

    開放式推理模型能夠更快、更廣泛地進行思考,為客戶服務、網(wǎng)絡安全、制造、物流和機器人等領(lǐng)域的 AI 智能生成更明智的結(jié)果。
    的頭像 發(fā)表于 08-13 14:32 ?1737次閱讀
    利用NVIDIA<b class='flag-5'>推理模型</b>構(gòu)建AI智能<b class='flag-5'>體</b>

    中國信通院發(fā)布“2025計算十大關(guān)鍵詞”

    、大模型工程化交付、大模型一體機、終端、智能混合、卓越架構(gòu)、央國企“
    的頭像 發(fā)表于 07-30 10:53 ?3317次閱讀
    中國信通院發(fā)布“<b class='flag-5'>2025</b><b class='flag-5'>云</b>計算十大關(guān)鍵詞”

    螞蟻數(shù)正式發(fā)布金融推理模型

    7月26日,以“智能時代,同球共濟”為主題的2025世界人工智能大會在上海開幕;亮點很多。我們看到在世界人工智能大會論壇上,螞蟻數(shù)正式發(fā)布了金融推理模型Agentar-Fin-R1
    的頭像 發(fā)表于 07-28 16:36 ?743次閱讀

    超低延時重構(gòu)AI推理體驗!白山發(fā)布“大模型API”產(chǎn)品

    優(yōu)勢,打造超低延時、超穩(wěn)定、簡單易用的API接口服務,降低大模型應用成本和開發(fā)門檻,助力企業(yè)和個人用戶快速開啟AI創(chuàng)新之旅。專注邊緣推理,構(gòu)建“”算力協(xié)同新范
    的頭像 發(fā)表于 07-02 17:26 ?1238次閱讀
    超低延時重構(gòu)AI<b class='flag-5'>推理</b>體驗!白山<b class='flag-5'>云</b>發(fā)布“大<b class='flag-5'>模型</b>API”產(chǎn)品

    開普「開悟智核」:極致性價比的智能一體機,破局大模型應用難題

    當下,AI一體機憑借開箱即用、數(shù)據(jù)可控等優(yōu)勢,成為行業(yè)大模型落地的重要載體之。然而實際應用時,用戶卻面臨諸多問題:算力成本與性能難以平衡;非滿血版模型存在“幻覺”、精度低等問題;由于
    的頭像 發(fā)表于 06-09 10:34 ?1289次閱讀
    開普<b class='flag-5'>云</b>「開悟智核」:極致性價比的智能<b class='flag-5'>體</b><b class='flag-5'>一體</b>機,破局大<b class='flag-5'>模型</b>應用難題

    DeepSeek賦能,大模型一體機破解企業(yè)AI落地難題

    數(shù)據(jù)訓練、模型部署等任務,確保敏感數(shù)據(jù)不外泄。 ? 其核心價值在于簡化部署流程、降低算力使用門檻,提升AI訓練與推理效率。據(jù)IDC報告,2025年中國AI大模型
    的頭像 發(fā)表于 06-09 07:13 ?6931次閱讀
    DeepSeek賦能,大<b class='flag-5'>模型</b><b class='flag-5'>一體</b>機破解企業(yè)AI落地難題