chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

軟件生態(tài)上超越CUDA,究竟有多難?

E4Life ? 來源:電子發(fā)燒友 ? 作者:周凱揚(yáng) ? 2024-06-20 00:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))近日,英偉達(dá)憑借持續(xù)上漲的股價(jià),正式超過了微軟成為全球市值最高的公司,這固然離不開GPU這一AI硬件的火熱,但之所以能一舉做到世界第一,也離不開軟件的加持,真正將其推向神壇的,還是圍繞CUDA打造的一系列軟件生態(tài)。

英偉達(dá)——CUDA的絕對統(tǒng)治

相信對GPU有過一定了解的都知道,英偉達(dá)的最大護(hù)城河就是CUDA。CUDA在后端架構(gòu)上處于絕對的統(tǒng)治地位,隨著AI發(fā)展越快,英偉達(dá)GPU+CUDA的開發(fā)生態(tài)發(fā)展愈發(fā)壯大,甚至到了很多競爭對手望其項(xiàng)背的水平。CUDA自2006年推出以來,即便在AI和深度學(xué)習(xí)沒有成為主流的時(shí)期,也在不斷發(fā)展并行計(jì)算,為開發(fā)者提供豐富的庫、工具和算法

時(shí)至今日,CUDA已經(jīng)為全球開發(fā)者打造了一個(gè)龐大的社區(qū),幾乎所有的深度學(xué)習(xí)框架,包括TensorFlow、Pytorch等都對CUDA做了優(yōu)化。為了盡快切入市場,絕大多數(shù)開發(fā)者都更傾向于選擇CUDA作為首要計(jì)算平臺。

與此同時(shí),英偉達(dá)也在圍繞著CUDA在硬件架構(gòu)上做更深入的創(chuàng)新和升級,借助更先進(jìn)的工藝和封裝技術(shù)提升計(jì)算性能和效率。比如隨著Volta架構(gòu)中引入Tensor核心后,英偉達(dá)GPU的矩陣運(yùn)算得到大幅加強(qiáng),深度學(xué)習(xí)訓(xùn)練和推理的性能實(shí)現(xiàn)飛躍。兩者結(jié)合之下,使得CUDA坐穩(wěn)了第一的寶座。

在游戲軟件領(lǐng)域,英偉達(dá)的DLSS可以說是市面上最先進(jìn)的專有超分技術(shù),且得益于持續(xù)的訓(xùn)練,每一次版本升級都能帶來圖形渲染領(lǐng)域的突破。

最后是生產(chǎn)力工具相關(guān)的軟件生態(tài)上,英偉達(dá)在這塊的優(yōu)勢就更加足了,過去蘋果與AMD還在GPU上合作之際,不少生產(chǎn)力工具還是針對AMD的GPU做了不少硬件優(yōu)化的。然而隨著蘋果走向Arm架構(gòu),英偉達(dá)慢慢在這個(gè)市場壯大起來。

無論是Adobe旗下的多媒體處理軟件,還是一些獨(dú)立開發(fā)商打造的軟件,很多都有英偉達(dá)CUDA硬件加速的支持,甚至連英特爾的核顯在一些軟件支持上,都要好于AMD。正因如此,除了一些特效制作相關(guān)的工作外,工作站里的AMD GPU越來越少。

盡管谷歌、英特爾和高通等科技巨頭也在尋找打破CUDA壟斷地位的契機(jī),但對于軟件生態(tài)而言,合作并不一定意味著共贏,最后很可能只是為市場提供更多的可選擇項(xiàng),但在易用性、性能等方面,仍不如沒有駐足一路狂奔的CUDA。

AMD

AMD對于其GPU軟件生態(tài)則持以較為開放的態(tài)度,且極其重視開源開發(fā)社區(qū)。AMD的ROCm對標(biāo)的正是英偉達(dá)的CUDA,但其并沒有對硬件做出限制,除了Radeon、Instinct系列的GPU外,也在擴(kuò)展至其他硬件廠商的設(shè)備。這也得益于AMD沒有在硬件內(nèi)引入Tensor核心這樣的專有硬件,但也正是因?yàn)槿绱耍瑢?dǎo)致其ROCm在某些任務(wù)上略顯遜色。

ROCm作為開源平臺,也提供多種庫和框架支持,也有一整套的開源工具鏈。正因如此,在HPC和云計(jì)算等領(lǐng)域,廠商其實(shí)更寧愿使用AMD的GPU,而不必要忍受英偉達(dá)的專用軟件棧。但苦于英偉達(dá)先行的軟件生態(tài),他們不得不首選英偉達(dá)的GPU。

AMD即便有了ROCm,整體軟件生態(tài)的成熟度依然不敵英偉達(dá),對于HPC中部分不以商業(yè)成功為目標(biāo)的項(xiàng)目而言,AMD已經(jīng)斬獲了不少份額,比如TOP500中前十的幾臺超算。但以整個(gè)TOP500榜單來看,英偉達(dá)依然占據(jù)主導(dǎo)地位。然而對于云供應(yīng)商來說,短時(shí)間內(nèi)依然沒法擺脫英偉達(dá)的統(tǒng)治,因?yàn)樽庥眠@些云服務(wù)的客戶們,更愿意在英偉達(dá)的CUDA平臺上開發(fā)。

在驅(qū)動(dòng)軟件上,尤其是針對Linux的顯卡驅(qū)動(dòng),AMD采取了開源和閉源兩條路線,持續(xù)更新閉源驅(qū)動(dòng)的同時(shí),也允許開源社區(qū)定制化開源驅(qū)動(dòng)。以基于Linux系統(tǒng)中AMD Radeon顯卡打造的Vulkan驅(qū)動(dòng)AMDVLK為例,就支持了光線追蹤。然而,盡管開源驅(qū)動(dòng)由于手動(dòng)配置和社區(qū)貢獻(xiàn)的原因,兼容性要更高一些,但如果追求的是更高的性能,那么閉源驅(qū)動(dòng)還是更具優(yōu)勢。

摩爾線程

國產(chǎn)GPU主要分為兩個(gè)方向,分別是支持圖形渲染的和不支持圖形渲染的,后者仍然想在AI領(lǐng)域內(nèi)突破,前者在推進(jìn)C端產(chǎn)品的同時(shí),也在布局B端的一系列AI GPU產(chǎn)品。在國產(chǎn)GPU產(chǎn)品中,在軟件生態(tài)上做得比較好的當(dāng)屬摩爾線程了,他們在AI和圖形渲染上的軟件支持都有喜人的進(jìn)展。

基于MUSA這一統(tǒng)一架構(gòu),摩爾線程打造了MTT S80這樣的桌面顯卡,以及面面向服務(wù)器應(yīng)用的MTT S3000等。與之配套的,是摩爾線程打造的軟件開發(fā)平臺,包括AI開發(fā)平臺、MUSA SDK、MT Smart Media和MTVerse XR等。

而且摩爾線程打造的這套生態(tài)架構(gòu)中,可以充分兼容現(xiàn)有軟件生態(tài),借助MUSIFY工具實(shí)現(xiàn)代碼零成本遷移到MUSA平臺。與AMD的ROCm一樣,MUSA做的也是兼容CUDA的路線,而不是像ZLUDA一樣重新編譯二進(jìn)制代碼,所以并不違反英偉達(dá)的EULA條款。

從摩爾線程近來官方發(fā)布的消息看來,他們在AI上選擇了逐步對大模型完成適配支持的路線。在摩爾線程的夸娥千卡智算集群上,他們已經(jīng)完成了30億到700億參數(shù)的大模型訓(xùn)練和推理適配。摩爾線程的GPU在算力上對比國際大廠還是略有遜色,不過隨著未來他們在IP、硬件設(shè)計(jì)上進(jìn)一步突破,相信他們也能打造出高性能的AI算力底座。

在針對消費(fèi)級圖形顯卡的驅(qū)動(dòng)程序上,摩爾線程也在不斷更新優(yōu)化性能。以5月底發(fā)布的v260.70版本驅(qū)動(dòng)為例,除了提供對OpenGL 4.0功能的支持和優(yōu)化Blender 3.6 LTS體驗(yàn)外,也為諸多熱門游戲在DirectX 11下的性能做了明顯優(yōu)化。盡管這類驅(qū)動(dòng)更新的規(guī)模比起英偉達(dá)還有所差距,但也代表了廠商持續(xù)優(yōu)化性能表現(xiàn)的決心。

寫在最后

其實(shí)從越來越多的廠商進(jìn)軍GPU,越來越多的GPU廠商發(fā)力AI就可以看出,即便CUDA有著深厚的生態(tài)積累,但在日新月異的AI中,其他廠商仍有分一杯羹的機(jī)會,甚至可能在某個(gè)應(yīng)用中后來者居上。但在圖形渲染相關(guān)的軟件生態(tài)上,廠商面臨的技術(shù)壁壘更加厚。不僅要帶著鉆研十?dāng)?shù)年的決心,還要持續(xù)打磨硬件產(chǎn)品,與產(chǎn)業(yè)軟件生態(tài)圈合作,挖掘和培養(yǎng)更多的圖形研究人才。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5259

    瀏覽量

    136039
  • CUDA
    +關(guān)注

    關(guān)注

    0

    文章

    128

    瀏覽量

    14544
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4112

    瀏覽量

    99597
  • 軟件生態(tài)系統(tǒng)

    關(guān)注

    0

    文章

    9

    瀏覽量

    7211
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    RV生態(tài)又一里程碑:英偉達(dá)官宣CUDA將兼容RISC-V架構(gòu)!

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)英偉達(dá)生態(tài)護(hù)城河CUDA,從最初支持x86、Power?CPU架構(gòu),到2019年宣布支持Arm?CPU,不斷拓展在數(shù)據(jù)中心的應(yīng)用生態(tài)。 在2019年至今的六年
    的頭像 發(fā)表于 07-19 00:04 ?6782次閱讀
    RV<b class='flag-5'>生態(tài)</b>又一里程碑:英偉達(dá)官宣<b class='flag-5'>CUDA</b>將兼容RISC-V架構(gòu)!

    借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計(jì)目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的一大優(yōu)勢是允許開發(fā)者基于其構(gòu)建自定義的 DSL。
    的頭像 發(fā)表于 02-10 10:31 ?498次閱讀

    聲智科技亮相2026瑞芯微AI軟件生態(tài)大會

    近日,瑞芯微 AI 軟件生態(tài)大會在福州召開,這場大會匯聚了各行各業(yè)逾500位AI軟件生態(tài)伙伴,包括業(yè)內(nèi)主流的基座模型伙伴、頭部AI軟件/算法
    的頭像 發(fā)表于 02-01 10:25 ?655次閱讀

    如何在NVIDIA CUDA Tile中編寫高性能矩陣乘法

    本博文是系列課程的一部分,旨在幫助開發(fā)者學(xué)習(xí) NVIDIA CUDA Tile 編程,掌握構(gòu)建高性能 GPU 內(nèi)核的方法,并以矩陣乘法作為核心示例。
    的頭像 發(fā)表于 01-22 16:43 ?5251次閱讀
    如何在NVIDIA <b class='flag-5'>CUDA</b> Tile中編寫高性能矩陣乘法

    NVIDIA CUDA Tile的創(chuàng)新之處、工作原理以及使用方法

    NVIDIA CUDA 13.1 推出 NVIDIA CUDA Tile,這是自 2006 年 NVIDIA CUDA 平臺發(fā)明以來,最大的一次技術(shù)進(jìn)步。這一令人振奮的創(chuàng)新引入了一套面向
    的頭像 發(fā)表于 12-24 10:17 ?622次閱讀
    NVIDIA <b class='flag-5'>CUDA</b> Tile的創(chuàng)新之處、工作原理以及使用方法

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的頭像 發(fā)表于 12-13 10:12 ?1387次閱讀
    在Python中借助NVIDIA <b class='flag-5'>CUDA</b> Tile簡化GPU編程

    NVIDIA CUDA 13.1版本的新增功能與改進(jìn)

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來,規(guī)模最大、內(nèi)容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?2429次閱讀

    首款全國產(chǎn)訓(xùn)推一體AI芯片發(fā)布,兼容CUDA生態(tài)

    CUDA生態(tài)體系。該芯片支持從單機(jī)多卡到千卡級集群的靈活擴(kuò)展,能效比達(dá)3.41 TFLOPS/W——在同等功
    的頭像 發(fā)表于 11-30 07:20 ?9731次閱讀
    首款全國產(chǎn)訓(xùn)推一體AI芯片發(fā)布,兼容<b class='flag-5'>CUDA</b><b class='flag-5'>生態(tài)</b>

    弱電智能化中究竟有多少個(gè)子系統(tǒng)?

    子系統(tǒng),每個(gè)子系統(tǒng)都承擔(dān)著特定的功能,共同為建筑提供全面的智能化服務(wù)。隨著技術(shù)的不斷進(jìn)步,弱電智能化系統(tǒng)的子系統(tǒng)也在不斷發(fā)展和完善。那么,弱電智能化中究竟有多少個(gè)子系統(tǒng)呢?本文將詳細(xì)列舉并介紹這些子系統(tǒng)。 一
    的頭像 發(fā)表于 11-24 09:57 ?1419次閱讀
    弱電智能化中<b class='flag-5'>究竟有</b>多少個(gè)子系統(tǒng)?

    中科芯亮相2025智能汽車基礎(chǔ)軟件生態(tài)大會

    此前,8月28日—29日,2025智能汽車基礎(chǔ)軟件生態(tài)大會暨第四屆中國汽車芯片大會在重慶召開。作為2025世界智能產(chǎn)業(yè)博覽會系列活動(dòng),大會以“開源拓界 眾行致遠(yuǎn)”為主題,來自政、產(chǎn)、學(xué)、研、用等領(lǐng)域的500多位專家、學(xué)者和企業(yè)代表共同探討開源共建模式的深化應(yīng)用、
    的頭像 發(fā)表于 09-29 11:01 ?1135次閱讀

    AUTOSAR亮相2025智能汽車基礎(chǔ)軟件生態(tài)大會

    此前,8月28日—29日,2025智能汽車基礎(chǔ)軟件生態(tài)大會暨第四屆中國汽車芯片大會在重慶召開。作為2025世界智能產(chǎn)業(yè)博覽會系列活動(dòng),大會以“開源拓界 眾行致遠(yuǎn)”為主題,來自政、產(chǎn)、學(xué)、研、用等領(lǐng)域的500多位專家、學(xué)者和企業(yè)代表共同探討開源共建模式的深化應(yīng)用、
    的頭像 發(fā)表于 09-22 14:33 ?1086次閱讀

    潤和軟件及潤開鴻出席鴻蒙生態(tài)大會2025

    )理事單位及鴻蒙生態(tài)核心伙伴,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)及旗下子公司江蘇潤開鴻數(shù)字科技有限公司(以下簡稱“潤開鴻”)共同出席大會,參與見證多項(xiàng)重磅標(biāo)準(zhǔn)發(fā)布,并通過行業(yè)議題分享、創(chuàng)新場景成果展示等呈現(xiàn)了自身面
    的頭像 發(fā)表于 09-06 19:14 ?2903次閱讀

    普華基礎(chǔ)軟件亮相2025智能汽車基礎(chǔ)軟件生態(tài)大會

    8月28日—29日,2025智能汽車基礎(chǔ)軟件生態(tài)大會暨第四屆中國汽車芯片大會在重慶渝州賓館盛大召開。29日上午舉辦的2025智能汽車基礎(chǔ)軟件生態(tài)大會上,來自政、產(chǎn)、學(xué)、研、用等領(lǐng)域的5
    的頭像 發(fā)表于 09-03 16:43 ?1543次閱讀

    Microsoft AD究竟有多重要

    勒索軟件攻防已成一場永無止境的貓鼠游戲——在IT和安全團(tuán)隊(duì)不斷提升能力的同時(shí),攻擊者也在不斷尋找新的攻擊路徑,而AD作為集中管理的核心要素,已成為勒索軟件攻擊的主要目標(biāo)和執(zhí)行路徑。
    的頭像 發(fā)表于 07-22 13:57 ?857次閱讀

    FOC電機(jī)控制究竟該如何學(xué)?

    學(xué)習(xí)FOC電機(jī)控制究竟是學(xué)哪些內(nèi)容? 電機(jī)知識 軟件知識 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內(nèi)容有幫助可以關(guān)注、點(diǎn)贊、評論支持一下哦~)
    發(fā)表于 05-09 14:09