chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

盤點(diǎn)國產(chǎn)GPU在支持大模型應(yīng)用方面的進(jìn)展

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-03-29 00:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)目前談到GPU,大家首先想到的應(yīng)該就是英偉達(dá)了。近一年多時(shí)間來,隨著大模型的發(fā)展,英偉達(dá)GPU的強(qiáng)大實(shí)力可謂無人不知。而相比之下,國產(chǎn)GPU的聲勢(shì)就小了許多。事實(shí)上,近些年國內(nèi)也有不少GPU企業(yè)在逐步成長,雖然在大模型的訓(xùn)練和推理方面,與英偉達(dá)GPU差距極大,但是不可忽視的是,不少國產(chǎn)GPU企業(yè)也在AI的訓(xùn)練和推理應(yīng)用上找到位置。

wKgZomYFRmmARSpxAAFSRafzhM0753.png

景嘉微

景嘉微是國產(chǎn)GPU市場的主要參與者,目前已經(jīng)完成JM5、JM7和JM9系列三代圖形處理芯片的研發(fā),并成功實(shí)現(xiàn)產(chǎn)業(yè)化。

2024年3月12日,該公司發(fā)布公告稱,其面向AI 訓(xùn)練、AI推理、科學(xué)計(jì)算等應(yīng)用領(lǐng)域的景宏系列高性能智算模塊及整機(jī)產(chǎn)品研發(fā)成功,并將盡快面向市場推廣。

根據(jù)公告,景宏系列支持INT8、FP16、FP32、FP64等混合精度運(yùn)算,支持全新的多卡互聯(lián)技術(shù)進(jìn)行算力擴(kuò)展,適配國內(nèi)外主流CPU、操作系統(tǒng)及服務(wù)器廠商,能夠支持當(dāng)前主流的計(jì)算生態(tài)、深度學(xué)習(xí)框架和算法模型庫,大幅縮短用戶適配驗(yàn)證周期。

海光信息

海光信息的產(chǎn)品包括海光通用處理器(CPU)和海光協(xié)處理器(DCU)。海光DCU屬于GPGPU 的一種,采用“類CUDA”通用并行計(jì)算架構(gòu),能夠較好地適配、適應(yīng)國際主流商業(yè)計(jì)算軟件和人工智能軟件。

海光8000系列具有全精度浮點(diǎn)數(shù)據(jù)和各種常見整型數(shù)據(jù)計(jì)算能力,具有最多64個(gè)計(jì)算單元,能夠充分挖掘應(yīng)用的并行性,發(fā)揮其大規(guī)模并行計(jì)算的能力,快速開發(fā)高能效的應(yīng)用程序。

海光DCU主要部署在服務(wù)器集群或數(shù)據(jù)中心,為應(yīng)用程序提供性能高、能效比高的算力,支撐高復(fù)雜度和高吞吐量的數(shù)據(jù)處理任務(wù)。在AIGC持續(xù)快速發(fā)展的時(shí)代背景下,海光DCU 能夠完整支持大模型訓(xùn)練,實(shí)現(xiàn)LLaMa、GPT、Bloom、ChatGLM、悟道、紫東太初等為代表的大模型的全面應(yīng)用,與國內(nèi)包括文心一言等大模型全面適配,達(dá)到國內(nèi)領(lǐng)先水平。

瀚博半導(dǎo)體

瀚博半導(dǎo)體成立于2018年12月,是一家GPU芯片提供商,致力于為人工智能核心算力和圖形渲染、內(nèi)容生成、AIGC提供全棧式芯片解決方案。瀚博目前擁有自主研發(fā)的核心IP以及兩代GPU芯片,并衍生AI、渲染、視頻三大產(chǎn)品線。

據(jù)介紹,其2023年推出的第二代GPU SG100芯片,采用7nm先進(jìn)制程,具備業(yè)界一流的渲染性能,同時(shí)兼具低延時(shí)高吞吐的AI算力和強(qiáng)大的視頻處理能力,可廣泛支持?jǐn)?shù)字孿生、數(shù)字人、云桌面、云手機(jī)、云游戲、云渲染、工業(yè)軟件等多領(lǐng)域應(yīng)用。

同時(shí)針對(duì)大模型時(shí)代算力需求,瀚博還首發(fā)了LLM大模型AI加速卡VA1L,具備200 TOPS INT8/72 TFLOPS FP16算力,并支持ChatGPT、LLaMA、Stable Diffusion等主流AIGC網(wǎng)絡(luò)模型。同時(shí),瀚博更重磅推出AIGC大模型一體機(jī),共使用8張LLM大模型AI加速卡VA1L,支持512GB顯存,進(jìn)而支持1750億參數(shù)的大模型。

摩爾線程

摩爾線程成立于2020年10月,是一家以全功能GPU芯片設(shè)計(jì)為主的集成電路公司。該公司已經(jīng)發(fā)布兩款自主研發(fā)的GPU芯片產(chǎn)品,2022年3月發(fā)布GPU產(chǎn)品“蘇堤”,11月又發(fā)布了第二款GPU芯片“春曉”。

“春曉”內(nèi)置MUSA架構(gòu)通用計(jì)算核心以及張量計(jì)算核心,可支持FP32、FP16和INT8三種計(jì)算精度;相較于其首款自研的GPU“蘇堤”,“春曉”內(nèi)置的四大計(jì)算引擎都進(jìn)行了全面升級(jí),性能顯著提升,AI計(jì)算加速平均提升4倍。

沐曦集成

沐曦成立于2020年9月,致力于為異構(gòu)計(jì)算提供全棧GPU芯片及解決方案,可廣泛應(yīng)用于智算、智慧城市、云計(jì)算、自動(dòng)駕駛、數(shù)字孿生、元宇宙等前沿領(lǐng)域。

沐曦集成目前有三條產(chǎn)品線規(guī)劃,曦思N系列GPU產(chǎn)品用于智算推理,曦云C系列GPU產(chǎn)品用于通用計(jì)算,曦彩G系列GPU產(chǎn)品用于圖形渲染。據(jù)沐曦此前對(duì)外透露,公司N系列云端推理芯片已經(jīng)量產(chǎn)出貨,C系列于2023年6月13日回片并完成測(cè)試。

沐曦產(chǎn)品均采用完全自主研發(fā)的GPU IP,擁有完全自主知識(shí)產(chǎn)權(quán)的指令集和架構(gòu),配以兼容主流GPU生態(tài)的完整軟件棧(MXMACA),具備高能效和高通用性的天然優(yōu)勢(shì),能夠?yàn)榭蛻魳?gòu)建軟硬件一體的全面生態(tài)解決方案。

天數(shù)智芯

天數(shù)智芯致力于開發(fā)自主可控、國際領(lǐng)先的高性能通用GPU產(chǎn)品,探索通用GPU趕超發(fā)展道路,加快建設(shè)自主產(chǎn)業(yè)生態(tài),為全產(chǎn)業(yè)提供高端算力解決方案。

天數(shù)智芯2018年正式啟動(dòng)通用GPU芯片設(shè)計(jì),在2021年發(fā)布了其通用GPU“天垓100”芯片及天垓100加速卡,2021年10月宣布天垓100正式進(jìn)入量產(chǎn)環(huán)節(jié)。2022年9月,又發(fā)布了首款7nm制程的云端推理通用GPU產(chǎn)品“智鎧100”。

智鎧 100 芯片支持 FP32、FP16、INT8 等多精度混合計(jì)算,實(shí)現(xiàn)了指令集增強(qiáng)、算力密度提升、計(jì)算存儲(chǔ)再平衡,支持多種視頻規(guī)格解碼。

燧原科技

燧原科技專注人工智能領(lǐng)域云端和邊緣算力產(chǎn)品,致力為通用人工智能打造算力底座,提供原始創(chuàng)新、具備自主知識(shí)產(chǎn)權(quán)的AI加速卡、系統(tǒng)集群和軟硬件解決方案。產(chǎn)品可廣泛應(yīng)用于泛互聯(lián)網(wǎng)、智算中心、智慧城市,智慧金融、科學(xué)計(jì)算、自動(dòng)駕駛等多個(gè)行業(yè)和場景。

該公司于2018年3月成立,僅用18個(gè)月時(shí)間,即發(fā)布第一代AI芯片邃思1.0,又于2021年7月發(fā)布邃思2.0。到現(xiàn)在,該公司已經(jīng)在兩款芯片的基礎(chǔ)上迭代了兩代訓(xùn)練和推理產(chǎn)品,第三代產(chǎn)品也已經(jīng)在研發(fā)中。并且,燧原科技已經(jīng)在科研領(lǐng)域和智慧城市的應(yīng)用中落地了訓(xùn)練和推理的超千卡算力集群。

登臨科技

登臨科技專注于芯片研發(fā)與技術(shù)創(chuàng)新,致力于打造云邊端一體、軟硬件協(xié)同的前沿芯片產(chǎn)品和平臺(tái)化基礎(chǔ)系統(tǒng)軟件。公司自主創(chuàng)新的GPU+(基于GPGPU的軟件定義的片內(nèi)異構(gòu)計(jì)算架構(gòu)),在兼容CUDA/OpenCL在內(nèi)的編程模型和軟件生態(tài)的基礎(chǔ)上,通過架構(gòu)創(chuàng)新,完美解決了通用性和高效率的雙重難題。

登臨首款基于GPU+的創(chuàng)新AI計(jì)算加速器Goldwasser已規(guī)模化運(yùn)用在各個(gè)應(yīng)用場景。未來將繼續(xù)秉承核心IP全自研的架構(gòu)實(shí)現(xiàn),以AI計(jì)算為主線,以創(chuàng)新為靈魂,加強(qiáng)核心IP自主研發(fā),加速產(chǎn)品在高級(jí)自動(dòng)駕駛,圖形加速等相關(guān)領(lǐng)域的開拓創(chuàng)新和商業(yè)化進(jìn)程。

寫在最后

GPU最初是為解決CPU在圖形處理領(lǐng)域性能不足的問題而誕生的,早期它多用于圖形處理,而如今大家談到用于AI訓(xùn)練和推理多是通用計(jì)算GPGPU,它脫胎于早期的圖形處理器。

上述談到的GPU企業(yè),有些既有用于AI計(jì)算的GPU產(chǎn)品,也有用于圖形處理的產(chǎn)品,如景嘉微,是國內(nèi)較早入局GPU市場的企業(yè),之前已經(jīng)發(fā)布過多個(gè)系列的產(chǎn)品,主要用于圖形處理。近期才公布面向AI 訓(xùn)練、AI推理、科學(xué)計(jì)算等應(yīng)用領(lǐng)域的GPU產(chǎn)品研發(fā)成功。

如沐曦入局GPU市場較晚,像用于AI訓(xùn)練、推理的產(chǎn)品,以及用于圖形渲染的產(chǎn)品都有規(guī)劃,不過它是先推出了用于AI計(jì)算的GPU芯片,而用于圖形渲染的產(chǎn)品預(yù)計(jì)要到2025年才發(fā)布。像瀚博半導(dǎo)體、摩爾線程等也是面向圖形渲染和AI計(jì)算都有產(chǎn)品。

面對(duì)現(xiàn)在關(guān)注比較多的大模型的訓(xùn)練和推理,國產(chǎn)GPU企業(yè)也在積極跟進(jìn),如海光DCU就能夠完整支持大模型訓(xùn)練,實(shí)現(xiàn)LLaMa、GPT、Bloom、ChatGLM、悟道、紫東太初等為代表的大模型的全面應(yīng)用;瀚博基于新一代GPU芯片首發(fā)了LLM大模型AI加速卡VA1L,能支持ChatGPT、LLaMA、Stable Diffusion等主流AIGC網(wǎng)絡(luò)模型。天數(shù)智芯、燧原科技等也都在支持大模型的應(yīng)用上取得進(jìn)展。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5115

    瀏覽量

    134539
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3485

    瀏覽量

    5023
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    成都匯陽投資關(guān)于國產(chǎn)開源模型持續(xù)突破,國產(chǎn)AI 競爭力增強(qiáng)

    ,國產(chǎn) AI 產(chǎn)業(yè)正展現(xiàn)出從技術(shù)追趕到特定領(lǐng)域?qū)崿F(xiàn)差異化領(lǐng)先的強(qiáng)勁趨勢(shì) 。 當(dāng)前的技術(shù)迭代的重點(diǎn)集中在編程和 Agent 能力等方面 ,同時(shí) ,國產(chǎn)
    的頭像 發(fā)表于 11-24 14:01 ?227次閱讀

    首款全國產(chǎn)通用GPU芯片發(fā)布 沐曦集成推出曦云C600

    ,并支持MetaXLink超節(jié)點(diǎn)擴(kuò)展技術(shù),硬件性能和軟件兼容上完全滿足下一代生成式AI的訓(xùn)練和推理需求。 而且,沐曦股份與中國科學(xué)院合作的國產(chǎn)千卡集群,已完成多個(gè)大模型全參數(shù)訓(xùn)練,證
    的頭像 發(fā)表于 10-19 20:04 ?4.5w次閱讀

    為什么無法GPU上使用INT8 和 INT4量化模型獲得輸出?

    安裝OpenVINO? 2024.0 版本。 使用 optimum-intel 程序包將 whisper-large-v3 模型轉(zhuǎn)換為 int 4 和 int8,并在 GPU 上使用 OpenVINO? 運(yùn)行推理。 沒有可用的輸出。
    發(fā)表于 06-23 07:11

    Imagination與澎峰科技攜手推動(dòng)GPU+AI解決方案,共拓計(jì)算生態(tài)

    的深度融合展開合作。雙方將結(jié)合 Imagination 領(lǐng)先的 GPU IP 技術(shù)與澎峰科技 AI 模型壓縮與性能優(yōu)化方面的軟硬協(xié)同能力,共同開拓面向 AI 行業(yè)應(yīng)用的計(jì)算解決方案
    發(fā)表于 05-21 09:40 ?1123次閱讀

    壁仞科技完成Qwen3旗艦模型適配

    近日,高效適配Qwen3系列模型推理后,壁仞科技宣布完成旗艦版Qwen3-235B-A22B模型的訓(xùn)練適配和優(yōu)化。由此,壁仞科技已實(shí)現(xiàn)Qwen3系列模型
    的頭像 發(fā)表于 05-16 16:23 ?806次閱讀

    摩爾線程GPU率先支持Qwen3全系列模型

    近日,阿里云正式發(fā)布Qwen3系列的8款開源混合推理模型。摩爾線程團(tuán)隊(duì)模型發(fā)布當(dāng)天,率先完成了Qwen3全系列模型全功能
    的頭像 發(fā)表于 05-07 15:24 ?870次閱讀

    摩爾線程GPU原生FP8計(jì)算助力AI訓(xùn)練

    并行訓(xùn)練和推理,顯著提升了訓(xùn)練效率與穩(wěn)定性。摩爾線程是國內(nèi)率先原生支持FP8計(jì)算精度的國產(chǎn)GPU企業(yè),此次開源不僅為AI訓(xùn)練和推理提供了全新的國產(chǎn)化解決方案,更對(duì)推動(dòng)
    的頭像 發(fā)表于 03-17 17:05 ?1267次閱讀
    摩爾線程<b class='flag-5'>GPU</b>原生FP8計(jì)算助力AI訓(xùn)練

    國產(chǎn)AI芯片破局:國產(chǎn)TCB設(shè)備首次完成CoWoS封裝工藝測(cè)試

    DeepSeek的突破性進(jìn)展,讓中國AI產(chǎn)業(yè)領(lǐng)域似乎迅速縮小了和美國的差距,然而整個(gè)國產(chǎn)模型的運(yùn)行仍高度依賴英偉達(dá)的芯片支持。盡管
    的頭像 發(fā)表于 03-14 11:09 ?1487次閱讀
    <b class='flag-5'>國產(chǎn)</b>AI芯片破局:<b class='flag-5'>國產(chǎn)</b>TCB設(shè)備首次完成CoWoS封裝工藝測(cè)試

    無法GPU上運(yùn)行ONNX模型的Benchmark_app怎么解決?

    CPU 和 GPU 上運(yùn)行OpenVINO? 2023.0 Benchmark_app推斷的 ONNX 模型。 CPU 上推理成功,但在
    發(fā)表于 03-06 08:02

    摩爾線程全面支持DeepSeek開源周成果

    DeepSeek開源周正式收官,作為國內(nèi)率先原生支持FP8計(jì)算精度的國產(chǎn)GPU企業(yè),摩爾線程迅速響應(yīng),并在短時(shí)間內(nèi),成功實(shí)現(xiàn)對(duì)DeepSeek各個(gè)開源項(xiàng)目的全面支持,涵蓋FlashML
    的頭像 發(fā)表于 03-04 10:06 ?874次閱讀

    飛騰CPU成功支持DeepSeek全系列大模型

    成功實(shí)現(xiàn)了對(duì)DeepSeek全系列大模型的端到端支持。 這一成就不僅覆蓋了數(shù)據(jù)中心場景,還全面擴(kuò)展到了終端場景,標(biāo)志著國產(chǎn)CPUAI大模型
    的頭像 發(fā)表于 02-10 14:26 ?1048次閱讀

    AMD將DeepSeek-V3模型集成至Instinct MI300X GPU

    AMD近日宣布了一項(xiàng)重要進(jìn)展,成功將全新的DeepSeek-V3模型集成到其Instinct MI300X GPU上。這一舉措標(biāo)志著AMDAI推理優(yōu)化
    的頭像 發(fā)表于 02-06 09:41 ?826次閱讀

    國產(chǎn)工控機(jī)軌道交通方面的應(yīng)用創(chuàng)新

    科技飛速發(fā)展的當(dāng)下,軌道交通作為現(xiàn)代城市交通的重要支柱,其高效運(yùn)行離不開先進(jìn)技術(shù)的支持。高能計(jì)算機(jī)推出的飛騰國產(chǎn)工控機(jī)GA-A3203憑借其卓越性能用FT2000/4 CPU,軌道
    的頭像 發(fā)表于 01-15 08:44 ?597次閱讀

    小米加速布局AI大模型,搭建GPU萬卡集群

    近日,有消息稱小米正在緊鑼密鼓地搭建自己的GPU萬卡集群,旨在加大對(duì)AI大模型的投入力度。據(jù)悉,小米的大模型團(tuán)隊(duì)成立之初就已經(jīng)擁有了6500張GP
    的頭像 發(fā)表于 12-28 14:25 ?808次閱讀

    GPU是如何訓(xùn)練AI大模型

    AI模型的訓(xùn)練過程中,大量的計(jì)算工作集中矩陣乘法、向量加法和激活函數(shù)等運(yùn)算上。這些運(yùn)算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU
    的頭像 發(fā)表于 12-19 17:54 ?1416次閱讀