chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息發(fā)布源2.0基礎(chǔ)大模型,千億參數(shù)全面開源

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2023-11-28 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

11月27日,浪潮信息發(fā)布"源2.0"基礎(chǔ)大模型,并宣布全面開源。源2.0基礎(chǔ)大模型包括1026億、518億、21億等三種參數(shù)規(guī)模的模型,在編程、推理、邏輯等方面展示出了先進的能力。

當前,大模型技術(shù)正在推動生成式人工智能產(chǎn)業(yè)迅猛發(fā)展,而基礎(chǔ)大模型的關(guān)鍵能力則是大模型在行業(yè)和應(yīng)用落地能力表現(xiàn)的核心支撐,但基礎(chǔ)大模型的發(fā)展也面臨著在算法、數(shù)據(jù)和算力等方面的諸多挑戰(zhàn)。源2.0基礎(chǔ)大模型則針對性地提出了新的改進方法并獲得了能力的提升。

算法方面,源2.0提出并采用了一種新型的注意力算法結(jié)構(gòu):局部注意力過濾增強機制(LFA:Localized Filtering-based Attention)。LFA通過先學習相鄰詞之間的關(guān)聯(lián)性,然后再計算全局關(guān)聯(lián)性的方法,能夠更好地學習到自然語言的局部和全局的語言特征,對于自然語言的關(guān)聯(lián)語義理解更準確、更人性,提升了模型的自然語言表達能力,進而提升了模型精度。

wKgZomVkrZuAFWGyAACX2OTQDsk961.jpg


數(shù)據(jù)方面,源2.0通過使用中英文書籍、百科、論文等高質(zhì)量中英文資料,降低了互聯(lián)網(wǎng)語料內(nèi)容占比,結(jié)合高效的數(shù)據(jù)清洗流程,為大模型訓練提供了高質(zhì)量的專業(yè)數(shù)據(jù)集和邏輯推理數(shù)據(jù)集。為了獲取中文數(shù)學數(shù)據(jù),我們清洗了從2018年至今約12PB的互聯(lián)網(wǎng)數(shù)據(jù),但僅獲取到了約10GB的數(shù)學數(shù)據(jù),投入巨大,收益較小。為了更高效地獲得相對匱乏的高質(zhì)量中文數(shù)學及代碼數(shù)據(jù)集,源2.0采用了基于大模型的數(shù)據(jù)生產(chǎn)及過濾方法,在保證數(shù)據(jù)的多樣性的同時也在每一個類別上提升數(shù)據(jù)質(zhì)量,獲取了一批高質(zhì)量的數(shù)學與代碼預(yù)訓練數(shù)據(jù)。

wKgaomVkrZuAeYSmAADRtny3Qdk117.jpg


算力方面,源2.0采用了非均勻流水并行的方法,綜合運用流水線并行+優(yōu)化器參數(shù)并行+數(shù)據(jù)并行的策略,讓模型在流水并行各階段的顯存占用量分布更均衡,避免出現(xiàn)顯存瓶頸導致的訓練效率降低的問題,該方法顯著降低了大模型對芯片間P2P帶寬的需求,為硬件差異較大訓練環(huán)境提供了一種高性能的訓練方法。

wKgaomVlP6mALQxWAAM0Ok9OLqE815.jpg


源2.0作為千億級基礎(chǔ)大模型,在業(yè)界公開的評測上進行了代碼生成、數(shù)學問題求解、事實問答方面的能力測試,測試結(jié)果顯示,源2.0在多項模型評測中,展示出了較為先進的能力表現(xiàn)。

wKgZomVkrZ6Af_R2AABvvDO94lM918.jpg


源2.0采用全面開源策略,全系列模型參數(shù)和代碼均可免費下載使用。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 半導體
    +關(guān)注

    關(guān)注

    336

    文章

    30093

    瀏覽量

    259396
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    476

    瀏覽量

    25318
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3496

    瀏覽量

    5032
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    浪潮信息發(fā)布"元腦SD200"超節(jié)點,面向萬億參數(shù)模型創(chuàng)新設(shè)計

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息發(fā)布面向萬億參數(shù)模型的超節(jié)點AI服務(wù)器"元腦SD200"。該產(chǎn)品基于浪潮信息創(chuàng)
    的頭像 發(fā)表于 08-08 22:17 ?552次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>&quot;元腦SD200&quot;超節(jié)點,面向萬億<b class='flag-5'>參數(shù)</b>大<b class='flag-5'>模型</b>創(chuàng)新設(shè)計

    飛利信與浪潮信息達成戰(zhàn)略合作

    近日,2025年浪潮信息北京ISP戰(zhàn)略伙伴簽約授牌儀式成功舉辦。浪潮信息與北京飛利信電子技術(shù)有限公司等22家戰(zhàn)略合作伙伴達成簽約,其中將面向北京人工智能應(yīng)用大市場,在產(chǎn)品技術(shù)共創(chuàng)、行業(yè)場景深化及區(qū)域
    的頭像 發(fā)表于 06-24 17:37 ?934次閱讀

    天瞳威視與浪潮信息達成戰(zhàn)略合作,推進高階智駕車載計算系統(tǒng)創(chuàng)新

    北京2025年3月22日?/美通社/ -- 近日,蘇州天瞳威視電子科技有限公司與浪潮信息旗下蘇州元腦智能科技有限公司達成戰(zhàn)略合作協(xié)議。此次合作依托浪潮信息提供的車載算力平臺硬件系統(tǒng)、底層軟件環(huán)境
    的頭像 發(fā)表于 03-27 16:55 ?562次閱讀
    天瞳威視與<b class='flag-5'>浪潮信息</b>達成戰(zhàn)略合作,推進高階智駕車載計算系統(tǒng)創(chuàng)新

    浪潮信息:元腦EPAI已接入DeepSeek,大幅提升DeepSeek企業(yè)應(yīng)用準確率

    北京2025年2月21日?/美通社/ -- 浪潮信息宣布元腦企智EPAI企業(yè)大模型開發(fā)平臺已全面接入支持DeepSeek大模型。通過元腦企智EPAI,企業(yè)用戶能夠?qū)I(yè)務(wù)數(shù)據(jù)與DeepS
    的頭像 發(fā)表于 02-23 07:32 ?903次閱讀
    <b class='flag-5'>浪潮信息</b>:元腦EPAI已接入DeepSeek,大幅提升DeepSeek企業(yè)應(yīng)用準確率

    浪潮信息發(fā)布元腦R1推理服務(wù)器

    近日,浪潮信息正式推出了其創(chuàng)新的元腦R1推理服務(wù)器。這款服務(wù)器通過系統(tǒng)的創(chuàng)新與軟硬件的協(xié)同優(yōu)化,實現(xiàn)了對DeepSeek R1 671B模型的單機部署與運行,為客戶在智能應(yīng)用部署方面帶來了顯著的突破
    的頭像 發(fā)表于 02-17 10:32 ?1070次閱讀

    浪潮信息存儲SATA SSD:技術(shù)創(chuàng)新引領(lǐng)數(shù)據(jù)存儲新時代

    在智慧時代,數(shù)據(jù)存儲需求日益增長,對存儲產(chǎn)品的性能和穩(wěn)定性提出了更高要求。浪潮信息存儲,作為行業(yè)內(nèi)的佼佼者,積極響應(yīng)市場需求,通過自主研發(fā),不斷積累技術(shù)優(yōu)勢,致力于為用戶提供高性能、高穩(wěn)定性的存儲
    的頭像 發(fā)表于 02-07 13:41 ?1053次閱讀

    浪潮信息存儲SATA SSD:以技術(shù)創(chuàng)新,開啟數(shù)據(jù)存儲新篇章

    計算平臺以及個人用戶的數(shù)字化需求,迫切需要高效、可靠的存儲解決方案。 浪潮信息存儲積極響應(yīng)市場需求,通過自主研發(fā)不斷積累技術(shù)優(yōu)勢,推出了SATA、NVMe、雙端口、ZNS等全系列存儲產(chǎn)品。近期,浪潮信息自研SATA SSD新品—TS6000G1,以出色的性能和
    的頭像 發(fā)表于 01-24 10:02 ?735次閱讀

    浪潮信息升級數(shù)據(jù)中心服務(wù)器故障智能診斷AIOps技術(shù)

    近日,浪潮信息對其數(shù)據(jù)中心服務(wù)器故障智能診斷AIOps技術(shù)進行了全面升級。該技術(shù)旨在解決數(shù)據(jù)中心服務(wù)器日常巡檢中故障人工識別效率低、難以精準定位的問題。 基于數(shù)百萬臺服務(wù)器的運維管理經(jīng)驗,浪潮信息
    的頭像 發(fā)表于 12-31 13:38 ?986次閱讀

    浪潮信息與智研究院攜手共建大模型多元算力生態(tài)

    近日,浪潮信息與北京智人工智能研究院正式簽署戰(zhàn)略合作協(xié)議,雙方將緊密合作,共同構(gòu)建大模型多元算力開源創(chuàng)新生態(tài)。 此次合作旨在提升大模型創(chuàng)新
    的頭像 發(fā)表于 12-31 11:49 ?901次閱讀

    開源模型在多個業(yè)務(wù)場景的應(yīng)用案例

    在人工智能發(fā)展浪潮中,大模型開源與閉之爭一直是業(yè)內(nèi)的熱點話題。隨著技術(shù)的不斷進步和應(yīng)用場景的日益豐富,如何降低大模型的使用門檻,讓更多人
    的頭像 發(fā)表于 12-30 10:16 ?1739次閱讀

    浪潮信息剖析智能時代數(shù)據(jù)存儲領(lǐng)域面臨的挑戰(zhàn)與機遇

    在當今數(shù)字化時代,算力與存力的協(xié)同增長已成為驅(qū)動各行各業(yè)發(fā)展的關(guān)鍵力量。特別是在人工智能(AI)這一前沿領(lǐng)域,隨著數(shù)據(jù)量的爆炸式增長,對存儲系統(tǒng)的需求日益復(fù)雜和多樣。近期,在首屆CCF中國存儲大會上,浪潮信息存儲首席架構(gòu)師孫斌深刻剖析了智能時代數(shù)據(jù)存儲領(lǐng)域面臨的挑戰(zhàn)與機遇。
    的頭像 發(fā)表于 12-30 09:43 ?1233次閱讀

    浪潮信息與智研究院達成戰(zhàn)略合作協(xié)議

    近日,浪潮信息與智研究院達成戰(zhàn)略合作協(xié)議,雙方將緊密協(xié)作共建大模型多元算力開源創(chuàng)新生態(tài),提升大模型創(chuàng)新研發(fā)的算力效率,降低大
    的頭像 發(fā)表于 12-26 10:25 ?924次閱讀

    浪潮信息發(fā)布&quot;&quot;Yuan-EB,刷新RAG檢索最高成績

    近日,浪潮信息在AI領(lǐng)域取得了重大突破,成功發(fā)布了其嵌入模型""Yuan-EB(Yuan-embedding-1.0)。在備受矚目的C-MTEB榜單中,"
    的頭像 發(fā)表于 12-25 15:54 ?835次閱讀

    浪潮信息與17家元腦伙伴共簽億級分銷協(xié)議

    近日,一場意義非凡的簽約儀式——2025年浪潮信息億級分銷伙伴簽約大會圓滿落幕。在這場盛會中,浪潮信息與來自全國12個省區(qū)的17家元腦生態(tài)伙伴共同簽署了億級分銷合作協(xié)議,攜手開啟合作共贏的新篇章
    的頭像 發(fā)表于 12-25 15:46 ?1213次閱讀

    捷通達攜手浪潮信息,ERP系統(tǒng)性能大幅提升

    在汽車市場服務(wù)領(lǐng)域,捷通達汽車集團股份有限公司一直保持著佼佼者的地位。為了進一步提升業(yè)務(wù)效率和客戶滿意度,捷通達與浪潮信息展開了深度合作,共同推動了原有SAP HANA系統(tǒng)的全面升級。 經(jīng)過雙方
    的頭像 發(fā)表于 12-24 14:36 ?925次閱讀