chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

梁文鋒署名DeepSeek新論文:突破GPU內(nèi)存限制的技術(shù)革命

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2026-01-14 11:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道 DeepSeek團隊發(fā)布了一篇由創(chuàng)始人梁文鋒署名的新論文,主題為《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(直譯為《基于可擴展查找的條件記憶:大語言模型稀疏性的新維度》)。這篇論文不僅揭示了當前大語言模型在知識檢索方面的低效問題,還通過創(chuàng)新的Engram架構(gòu),將模型的“條件記憶”與“計算”分離,從而大幅降低錯誤率并節(jié)省算力。

條件記憶與Engram架構(gòu)

論文的核心創(chuàng)新點在于提出了“條件記憶”這一概念,旨在解決當前大語言模型在知識檢索方面的低效和算力消耗問題。梁文鋒團隊指出,語言建模本質(zhì)上包含兩類子任務(wù):一類是組合式推理,需要依賴深層、動態(tài)計算完成;另一類是知識檢索,面向命名實體等相對靜態(tài)的內(nèi)容,理論上可以通過簡單查找更高效地處理。然而,現(xiàn)有Transformer架構(gòu)缺乏原生的查找組件,遇到靜態(tài)信息時往往仍需反復調(diào)用深層網(wǎng)絡(luò)進行重建,加劇了算力浪費并推高了推理成本。

為了解決這一問題,DeepSeek團隊提出了Engram架構(gòu)(記憶痕跡架構(gòu)),通過將靜態(tài)知識存儲與動態(tài)計算分離,實現(xiàn)了靜態(tài)模式的常數(shù)時間O(1)查找。具體而言,條件記憶通過Engram模塊實現(xiàn),模型能夠基于輸入中的局部上下文模式,從大規(guī)模參數(shù)化記憶中快速檢索并融合靜態(tài)知識表示,從而避免在推理過程中反復通過深層計算重建高頻、模板化信息。

突破GPU內(nèi)存限制

在GPU內(nèi)存限制方面,DeepSeek的新論文同樣帶來了革命性的突破。傳統(tǒng)上,GPU內(nèi)存容量有限,處理大規(guī)模數(shù)據(jù)集時往往需要頻繁的數(shù)據(jù)傳輸和復雜的數(shù)據(jù)管理策略。而Engram架構(gòu)通過稀疏存儲模式,支持更大規(guī)模的知識存入,突破了傳統(tǒng)注意力窗口的物理限制。當大約20%至25%的稀疏參數(shù)預算分配給Engram,剩余部分留給混合專家模型(MoE)時,模型性能達到最佳。

此外,DeepSeek團隊還通過優(yōu)化數(shù)據(jù)流動和調(diào)度機制,進一步降低了GPU內(nèi)存的壓力。例如,采用預取策略預測后續(xù)計算所需數(shù)據(jù),提前從低速層加載至高速層;通過淘汰策略根據(jù)訪問頻率與重要性,將不活躍數(shù)據(jù)逐出至低速層;以及利用壓縮策略對暫存于內(nèi)存或磁盤的數(shù)據(jù)進行無損或有損壓縮,減少I/O開銷。這些技術(shù)手段的結(jié)合,使得GPU在處理大規(guī)模數(shù)據(jù)集時能夠更加高效地利用內(nèi)存資源。

當前,全球高端GPU資源90%集中于美國企業(yè),且美國政府通過《芯片與科學法案》對中國實施高端GPU限售,直接導致中國AI企業(yè)面臨“硬件卡脖子”困境。以訓練千億參數(shù)模型為例,傳統(tǒng)架構(gòu)需配置數(shù)萬塊H100 GPU,單次訓練成本超1億美元,而內(nèi)存瓶頸更使模型規(guī)模受限于物理顯存容量。

DeepSeek的Engram架構(gòu)通過稀疏存儲與動態(tài)計算分離技術(shù),使模型在同等硬件條件下可處理3-5倍規(guī)模的參數(shù)。實驗數(shù)據(jù)顯示,其27B參數(shù)模型在32k上下文任務(wù)中,內(nèi)存占用僅增加25%卻實現(xiàn)13%的準確率提升。這種技術(shù)突破不僅降低中國AI企業(yè)對進口芯片的依賴度,更通過內(nèi)存效率優(yōu)化使現(xiàn)有硬件產(chǎn)能釋放3倍以上算力。

結(jié)語

DeepSeek團隊此次發(fā)布的新論文,不僅揭示了當前大語言模型在知識檢索方面的低效問題,還通過創(chuàng)新的Engram架構(gòu)和條件記憶概念,實現(xiàn)了GPU內(nèi)存限制的革命性突破。這一技術(shù)突破不僅提高了模型運行效率,還為中國AI發(fā)展提供了戰(zhàn)略支撐。在全球AI競爭日益激烈的背景下,DeepSeek的探索為中國AI企業(yè)開辟了一條自主創(chuàng)新、突破封鎖的發(fā)展道路。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5258

    瀏覽量

    136032
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    837

    瀏覽量

    3390
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    內(nèi)存要取代GPU?HBM之父警告:以英偉達GPU為核心的架構(gòu)要被顛覆

    電子發(fā)燒友網(wǎng)報道(/浩斌)“主板插顯卡上”,是PC DIY玩家對高性能顯卡體積越來越大的調(diào)侃,隨著顯卡功率越來越高,碩大的散熱模組讓顯卡投影面積甚至已經(jīng)大于ITX規(guī)格的主板,在PC里顯卡取代了
    的頭像 發(fā)表于 04-03 09:54 ?6610次閱讀
    <b class='flag-5'>內(nèi)存</b>要取代<b class='flag-5'>GPU</b>?HBM之父警告:以英偉達<b class='flag-5'>GPU</b>為核心的架構(gòu)要被顛覆

    DeepSeek V3.1發(fā)布!擁抱國產(chǎn)算力芯片

    電子發(fā)燒友網(wǎng)報道(/李彎彎)2025年8月21日,DeepSeek正式官宣發(fā)布DeepSeek-V3.1大模型。新版本不僅在技術(shù)架構(gòu)上實現(xiàn)重大升級,更通過參數(shù)精度優(yōu)化與國產(chǎn)芯片深度適
    的頭像 發(fā)表于 08-23 07:55 ?1.7w次閱讀
    <b class='flag-5'>DeepSeek</b> V3.1發(fā)布!擁抱國產(chǎn)算力芯片

    探索DeepSeek多樣化技術(shù)路徑,英特爾架構(gòu)師用至強CPU嘗鮮

    近期大模型領(lǐng)域里最火的熱詞,或者說技術(shù)創(chuàng)新點,非Engram (DeepSeek新論文里設(shè)計的Engram機制) 莫屬。今天我們想分享的,是英特爾圍繞Engram開展的早期探索——用至強? 處理器
    的頭像 發(fā)表于 02-05 11:13 ?519次閱讀
    探索<b class='flag-5'>DeepSeek</b>多樣化<b class='flag-5'>技術(shù)</b>路徑,英特爾架構(gòu)師用至強CPU嘗鮮

    《電子發(fā)燒友電子設(shè)計周報》聚焦硬科技領(lǐng)域核心價值 26年第1期:2026.1.4--2025.1.16

    :具身智能邁入“大小腦協(xié)同”新紀元 8、全球首款5G-A車載模組發(fā)布!打開萬億車聯(lián)網(wǎng)市場發(fā)展新維度 9、署名DeepSeek
    發(fā)表于 01-16 20:20

    DeepSeek開源Engram:讓大模型擁有&quot;過目不忘&quot;的類腦記憶

    2026年1月13日凌晨,DeepSeek突然發(fā)布由創(chuàng)始人署名新論文《Condition
    的頭像 發(fā)表于 01-14 16:07 ?444次閱讀
    <b class='flag-5'>DeepSeek</b>開源Engram:讓大模型擁有&quot;過目不忘&quot;的類腦記憶

    TGV產(chǎn)業(yè)發(fā)展:玻璃通孔技術(shù)如何突破力學瓶頸?

    在后摩爾時代,芯片算力提升的突破口已從單純依賴制程工藝轉(zhuǎn)向先進封裝技術(shù)。當硅基芯片逼近物理極限,2.5D/3D堆疊技術(shù)通過Chiplet(芯粒)拆分與異構(gòu)集成,成為突破光罩
    的頭像 發(fā)表于 10-21 07:54 ?1169次閱讀

    科普:什么AI 內(nèi)存技術(shù)

    問題。 為什么 AI 內(nèi)存很重要? 在 AI 模型訓練和推理過程中,大量的數(shù)據(jù)需要從內(nèi)存傳輸?shù)教幚砥鳎ㄈ?GPU 或 TPU)進行計算。傳統(tǒng)的內(nèi)存
    的頭像 發(fā)表于 09-03 15:44 ?1625次閱讀

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】+混合專家

    感謝電子發(fā)燒友提供學習Deepseek核心技術(shù)這本書的機會。 讀完《Deepseek核心技術(shù)揭秘》,我深受觸動,對人工智能領(lǐng)域有了全新的認識。了解D
    發(fā)表于 07-22 22:14

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】--全書概覽

    感謝平臺提供的書籍,實物如下 這本書主講從年前開始火熱的DeepSeek 。書籍看起來輕薄,但言簡意賅,通俗易懂,總覽全局,比較精煉。 第一章 介紹DeepSeek的一系列技術(shù)突破與創(chuàng)
    發(fā)表于 07-21 00:04

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】第三章:探索 DeepSeek - V3 技術(shù)架構(gòu)的奧秘

    時間減少,數(shù)據(jù)處理更流暢。這讓我聯(lián)想到工業(yè)生產(chǎn)中的流水線,AI 訓練在此處借鑒類似思路,通過優(yōu)化任務(wù)分配和流程,突破硬件限制,追求更高效率,體現(xiàn)了技術(shù)發(fā)展中持續(xù)優(yōu)化、突破瓶頸的智慧。
    發(fā)表于 07-20 15:07

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】書籍介紹+第一章讀后心得

    這本書有150多頁,而且是彩色印刷的,圖、表很多而且很有條理性。 書籍前言介紹如下: 第1章 介紹 DeepSeek 的一系列技術(shù)突破與創(chuàng)新,如架構(gòu)創(chuàng)新、訓練優(yōu)化、推理與部署優(yōu)化等,讓讀者
    發(fā)表于 07-17 11:59

    【書籍評測活動NO.62】一本書讀懂 DeepSeek 全家桶核心技術(shù)DeepSeek 核心技術(shù)揭秘

    DeepSeek-V3技術(shù)突破 DeepSeek-V3 的模型架構(gòu)整體上基于 Transformer 的 MoE 架構(gòu),并在細節(jié)實現(xiàn)上做了大量的創(chuàng)新和優(yōu)化,如大量小專家模型、多頭潛在
    發(fā)表于 06-09 14:38

    DeepSeek 引領(lǐng)邊緣 AI 芯片向更高性能、更低功耗、更強泛化能力的方向演進

    )等優(yōu)化技術(shù),從而在性能上取得優(yōu)異表現(xiàn)。但其計算和內(nèi)存需求也極高:部署原始的大型模型往往需要多卡 GPU 集群(如數(shù)十到上百塊 H100)才能在
    的頭像 發(fā)表于 05-09 10:27 ?2400次閱讀

    顛覆傳統(tǒng)連接認知:M12 航空接頭的快速插拔技術(shù)革命

    M12 航空接頭的快速插拔技術(shù),不僅為工業(yè)連接帶來了顛覆性的變革,更是打開了設(shè)備升級發(fā)展的全新大門。從智能制造到智慧檢測,從交通樞紐到能源工程,這場技術(shù)革命正以磅礴之勢重塑工業(yè)連接的新格局,引領(lǐng)連接領(lǐng)域邁向高效、智能的嶄新時代。
    的頭像 發(fā)表于 04-30 11:21 ?2331次閱讀
    顛覆傳統(tǒng)連接認知:M12 航空接頭的快速插拔<b class='flag-5'>技術(shù)革命</b>

    DeepSeek創(chuàng)始人入選《時代》最具影響力100人

    據(jù)外媒報道,美國《時代》周刊2025年全球100最具影響力人物正式公布了榜單。根據(jù)榜單數(shù)據(jù)顯示,DeepSeek創(chuàng)始人上榜。《時代》周刊這樣描述;
    的頭像 發(fā)表于 04-19 11:21 ?1126次閱讀