chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

“網(wǎng)紅”芯片Groq讓英偉達(dá)蒸發(fā)5600億

AI芯天下 ? 來源:AI芯天下 ? 2024-02-27 15:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言: 鑒于ChatGPT的廣泛應(yīng)用,引發(fā)了AI算力需求的迅猛增長,使得英偉達(dá)的AI芯片供不應(yīng)求,出現(xiàn)大規(guī)模短缺。如今,英偉達(dá)似乎在面對(duì)更多挑戰(zhàn)。

比英偉達(dá)GPU快10倍的LPU

近兩天,一家名為Groq的美國人工智能公司受到了廣泛關(guān)注,其主要原因在于其自主研發(fā)的LPU芯片在人工智能推理技術(shù)上取得了突破。

通過優(yōu)化架構(gòu)和減少內(nèi)存瓶頸,Groq的LPU芯片在大模型處理方面展現(xiàn)出高效率和低延遲的特點(diǎn),速度遠(yuǎn)超英偉達(dá)GPU,每秒生成速度接近500 tokens,而GPT-4僅40 tokens。

因此,Groq LPU被譽(yù)為[史上最快的大模型技術(shù)]。

81f18d12-d4a5-11ee-a297-92fbcf53809c.png

Groq LPU的工作原理與英偉達(dá)的GPU不同,它采用了名為時(shí)序指令集計(jì)算機(jī)(Temporal Instruction Set Computer)架構(gòu),使用存儲(chǔ)器為靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),其速度比GPU所用的高帶寬存儲(chǔ)器(HBM)快約20倍。

據(jù)Groq在2024年1月的第一個(gè)公開基準(zhǔn)測(cè)試,由Groq LPU驅(qū)動(dòng)的Meta Llama 2-70B模型,推理性能比其他頂級(jí)云計(jì)算供應(yīng)商快18倍。

artificialanalysis.ai給出的測(cè)評(píng)結(jié)果也顯示,Groq的吞吐量速度稱得上是[遙遙領(lǐng)先]。

總結(jié)起來,Groq的架構(gòu)建立在小內(nèi)存,大算力上,因此有限的被處理的內(nèi)容對(duì)應(yīng)著極高的算力,導(dǎo)致其速度非???。

有分析人士稱,在A100和H100相對(duì)緊缺的時(shí)代,LPU或許會(huì)成為大模型開發(fā)商的新選擇。

820d6802-d4a5-11ee-a297-92fbcf53809c.png

Grop部署起來甚至比英偉達(dá)要貴

當(dāng)初Groq以其閃電般的速度令A(yù)I行業(yè)為之震撼。

然而,在震撼之余,許多業(yè)界人士核算后發(fā)現(xiàn),這種速度背后的代價(jià)可能過于高昂。

Groq的LPU芯片摒棄了HBM,僅依賴SRAM進(jìn)行計(jì)算。

盡管這種方式確實(shí)帶來了令人矚目的計(jì)算速度,但其成本效益問題卻備受質(zhì)疑。

值得關(guān)注的是,盡管Groq在速度上表現(xiàn)出色,但其背后的成本卻相當(dāng)高昂。

若以未來三年運(yùn)行成本計(jì)算,Groq的硬件采購成本高達(dá)1144萬美元,而運(yùn)營成本至少為76.2萬美元。

據(jù)此估算,在同等吞吐量下,Groq的硬件成本約為H100的40倍,能耗成本則是10倍。

若考慮運(yùn)營三年,Groq硬件的購買成本為114.4萬美元,運(yùn)營成本為76.2萬。

另一方面,對(duì)于一個(gè)8卡的H100盒子,硬件購買成本為30萬美元,運(yùn)營成本約為7.2萬或稍低。

由于Groq內(nèi)存容量相對(duì)較?。?30MB),在運(yùn)行Llama-270b模型時(shí),需配備305張Groq卡才能滿足需求,而使用H100僅需8張卡。

因此,從當(dāng)前價(jià)格來看,在同等吞吐量下,Groq的硬件成本是H100的40倍,能耗成本是10倍。

換言之,Groq的高速性能是建立在有限的單卡吞吐能力基礎(chǔ)之上的。

為實(shí)現(xiàn)與H100相同的吞吐量,Groq需采用更多張顯卡。

在此背景下,[速度]成為了Groq的一把雙刃劍。

8222e222-d4a5-11ee-a297-92fbcf53809c.png

Groq喊話[三年內(nèi)趕超英偉達(dá)]

近期,一位自稱為Groq員工的用戶在與網(wǎng)絡(luò)用戶互動(dòng)時(shí)表示,Groq致力于成為最快速的大規(guī)模模型硬件,并誓言在三年內(nèi)超越英偉達(dá)。

然而,截至2月20日美股收盤,英偉達(dá)股價(jià)單日跌幅達(dá)4.35%,創(chuàng)下去年10月以來最大單日跌幅,市值一夜之間縮水780億美元(約合5600億元人民幣)。

盡管Groq速度迅猛,但價(jià)格較高,目前尚不能與英偉達(dá)抗衡。SRAM技術(shù)面積大、功耗高,早已以IP內(nèi)核形式集成至系統(tǒng)級(jí)芯片(SoC),而非單獨(dú)應(yīng)用,其未來發(fā)展?jié)摿h(yuǎn)不及HBM(高帶寬內(nèi)存)。

在單位容量價(jià)格、性能及功耗方面,英偉達(dá)GPU所采用的HBM技術(shù)均優(yōu)于SRAM。

從技術(shù)和性能角度看,Groq目前尚無法撼動(dòng)英偉達(dá)的地位。

原因在于,英偉達(dá)GPU產(chǎn)品具有通用性,而Groq產(chǎn)品為ASIC(專用集成電路),并非通用產(chǎn)品,而是定制產(chǎn)品。

換言之,任何人工智能算法均可使用英偉達(dá)的H200,但僅Mixtral和Llama2能采用Groq的LPU。

欲使用Groq產(chǎn)品,大模型公司需先明確需求、指定規(guī)格,然后進(jìn)行功能驗(yàn)證,最終生產(chǎn)出的產(chǎn)品方可投入使用。

英偉達(dá)財(cái)報(bào)再次印證了其在人工智能浪潮中成為最大贏家的地位。

英偉達(dá)于北京時(shí)間2月22日發(fā)布截至2024年1月28日的四季度業(yè)績報(bào)告。

報(bào)告顯示,公司季度營收創(chuàng)紀(jì)錄達(dá)到221億美元,遠(yuǎn)超英偉達(dá)自身及華爾街預(yù)期,同比增長265%。

全年?duì)I收同樣創(chuàng)下新高,達(dá)到609億美元,同比增長126%。

英偉達(dá)預(yù)計(jì)本季度營收將進(jìn)一步攀升至240億美元。財(cái)報(bào)發(fā)布后,其股價(jià)盤后一度漲超10%。

82387736-d4a5-11ee-a297-92fbcf53809c.png

結(jié)尾:

Groq架構(gòu)的特點(diǎn)是小內(nèi)存和大算力,適合頻繁數(shù)據(jù)搬運(yùn)的場景,速度快但單卡吞吐能力有限,需要更多卡來保證同等吞吐量,速度既是優(yōu)勢(shì)也是劣勢(shì)。

此外,由于GPU的生態(tài)極為發(fā)達(dá),其中英偉達(dá)的GPU不僅性能強(qiáng)大,在性能卓越的同時(shí),還聚集了大量用戶和豐富的生態(tài)環(huán)境。

相比之下,Groq 目前僅能為少數(shù)大型模型提供服務(wù),想要在低延遲領(lǐng)域建立持續(xù)優(yōu)勢(shì),需要拓寬服務(wù)范圍并進(jìn)一步減少總體成本。


審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    39

    文章

    7753

    瀏覽量

    172152
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4112

    瀏覽量

    99591
  • HBM
    HBM
    +關(guān)注

    關(guān)注

    2

    文章

    432

    瀏覽量

    15878
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    307

    瀏覽量

    6553
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1599

    瀏覽量

    10388

原文標(biāo)題:熱點(diǎn)丨“網(wǎng)紅”芯片Groq讓英偉達(dá)蒸發(fā)5600億

文章出處:【微信號(hào):World_2078,微信公眾號(hào):AI芯天下】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    套現(xiàn)413!軟銀清倉英偉達(dá),AI硬件泡沫破裂?

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)前幾天,全球知名的科技投資公司日本軟銀集團(tuán)(SBG)突然宣布,公司已經(jīng)在今年10月出售了所持有的全部英偉達(dá)股票,共計(jì)3210萬股,套現(xiàn)58美元(約合人民
    的頭像 發(fā)表于 11-13 09:19 ?6151次閱讀

    AI推理需求井噴!英偉達(dá)Q1營收大漲,H20禁售難擋增長步伐

    電子發(fā)燒友原創(chuàng) 章鷹 在中美科技企業(yè)爭奪人工智能高地的競爭中,處于第一方陣的美國AI芯片公司英偉達(dá)公司最新交出了市場滿意的答卷。 5月28日,英偉
    的頭像 發(fā)表于 05-31 01:13 ?8375次閱讀
    AI推理需求井噴!<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>Q1營收大漲,H20禁售難擋增長步伐

    硅光成AI勝負(fù)手?英偉達(dá)20美元戰(zhàn)略投資Marvell

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)當(dāng)?shù)貢r(shí)間 3 月 31 日(周二),全球市值最高的半導(dǎo)體企業(yè)英偉達(dá)正式宣布,向美國半導(dǎo)體廠商邁威爾科技(Marvell,MRVL.US)戰(zhàn)略投資 20
    的頭像 發(fā)表于 04-06 07:02 ?1.1w次閱讀

    GPU不是AI的唯一解:英偉達(dá)Groq LPU證明,推理賽道需要“另一條腿”

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)過去十年,人工智能的爆發(fā)式增長與GPU需求緊密相連。憑借其卓越的并行計(jì)算能力,GPU成為AI算力的絕對(duì)代名詞。 ? 然而,英偉達(dá)給出顛覆性的新解。在最新的GTC
    的頭像 發(fā)表于 03-24 11:27 ?5976次閱讀
    GPU不是AI的唯一解:<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>用<b class='flag-5'>Groq</b> LPU證明,推理賽道需要“另一條腿”

    英偉達(dá)Rubin GPU采用鉆石銅散熱,解決芯片散熱難題

    電子發(fā)燒友網(wǎng)綜合報(bào)道 在AI算力狂飆的時(shí)代,芯片散熱問題成為制約技術(shù)發(fā)展的關(guān)鍵瓶頸。英偉達(dá)下一代Vera Rubin架構(gòu)GPU,將全面采用“鉆石銅復(fù)合散熱 + 45℃溫水直液冷”全新方
    的頭像 發(fā)表于 02-05 13:46 ?5320次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>Rubin GPU采用鉆石銅散熱,解決<b class='flag-5'>芯片</b>散熱難題

    英偉達(dá)重磅出手!AI 推理存儲(chǔ)全面覺醒

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)近日,有消息稱,英偉達(dá)將以大約200美元收購人工智能芯片初創(chuàng)公司Groq
    的頭像 發(fā)表于 12-26 08:44 ?1.2w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>重磅出手!AI 推理存儲(chǔ)全面覺醒

    200美元!英偉達(dá)擬重金收購AI芯片初創(chuàng)公司Groq

    行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2025年12月25日 11:09:27

    英偉達(dá) Q3 狂攬 308

    廠商季度合計(jì) 500 美元資本支出中,約 30% 流向了英偉達(dá)。 新一代 Blackwell 芯片已全面投產(chǎn),Q3 交付 1.3 萬個(gè) GPU 樣品,H200 GPU 理論性能較 H
    的頭像 發(fā)表于 11-20 18:11 ?1350次閱讀

    黃仁勛:英偉達(dá)AI芯片訂單排到2026年 英偉達(dá)上季營收加速增長62%再超預(yù)期

    AI芯片總龍頭英偉達(dá)的財(cái)報(bào)終于帶來了驚喜;英偉達(dá)公司發(fā)布財(cái)報(bào)數(shù)據(jù)顯示,上季營收加速增長62%;再超華爾街預(yù)期。業(yè)界都比較振奮,
    的頭像 發(fā)表于 11-20 11:36 ?1433次閱讀

    NVIDIA新聞:英偉達(dá)10美元入股諾基亞 英偉達(dá)推出全新量子設(shè)備

    給大家分享一些NVIDIA新聞: 英偉達(dá)10美元入股諾基亞 在當(dāng)?shù)貢r(shí)間10月28日,英偉達(dá)正式宣布將以10
    的頭像 發(fā)表于 10-29 17:12 ?2368次閱讀

    英偉達(dá)斥資50美元入股英特爾,芯片巨頭攜手重塑行業(yè)格局

    在科技行業(yè)引發(fā)廣泛關(guān)注的重大事件中,當(dāng)?shù)貢r(shí)間9月18日,全球知名的芯片企業(yè)英偉達(dá)宣布,將斥資50美元入股英特爾,雙方還達(dá)成合作協(xié)議,共同致力于人工智能基礎(chǔ)設(shè)施和個(gè)人計(jì)算產(chǎn)品的聯(lián)合開發(fā)
    的頭像 發(fā)表于 09-22 17:35 ?974次閱讀

    國家網(wǎng)信辦約談英偉達(dá)

    近日,英偉達(dá)算力芯片被曝出存在嚴(yán)重安全問題。此前,美議員呼吁要求美出口的先進(jìn)芯片必須配備“追蹤定位”功能。美人工智能領(lǐng)域?qū)<彝嘎叮?b class='flag-5'>英偉
    的頭像 發(fā)表于 07-31 13:56 ?2818次閱讀
    國家<b class='flag-5'>網(wǎng)</b>信辦約談<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>

    擺脫依賴英偉達(dá)!OpenAI首次轉(zhuǎn)向使用谷歌芯片

    地使用非英偉達(dá)芯片,更顯示出其正在逐步擺脫對(duì)英偉達(dá)芯片的深度依賴,在算力布局上邁出了重要戰(zhàn)略調(diào)整
    的頭像 發(fā)表于 07-02 00:59 ?8554次閱讀

    英偉達(dá)2026財(cái)年Q1營收公布 一季度營收441美元 英偉達(dá)Q1凈利潤187.8美元

    英偉達(dá)的業(yè)績暴漲神話依然在繼續(xù),在5月29日英偉達(dá)公司發(fā)布了2026財(cái)年第一季度財(cái)報(bào)。財(cái)報(bào)數(shù)據(jù)顯示,該季度英偉
    的頭像 發(fā)表于 05-29 17:58 ?1257次閱讀