chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ChatGPT需要怎樣的芯片?

Dbwd_Imgtec ? 來源:未知 ? 2023-02-17 09:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近,以ChatGPT為首的生成類模型已經(jīng)成為了人工智能的新熱點,硅谷的微軟、谷歌等都紛紛大舉投資此類技術(shù)(微軟100億美元入股ChatGPT背后的OpenAI,谷歌也于近日發(fā)布了自研的BARD模型),而在中國以百度等為代表的互聯(lián)網(wǎng)科技公司也紛紛表示正在研發(fā)此類技術(shù)并且將于近期上線。以ChatGPT為代表的生成類模型有一個共同的特點,就是使用了海量數(shù)據(jù)做預訓練,并且往往會搭配一個較為強大的語言模型。語言模型主要的功能是從海量的現(xiàn)有語料庫中進行學習,在經(jīng)過學習之后可以理解用戶的語言指令,或者更進一步根據(jù)用戶的指令去生成相關(guān)的文字輸出。生成類模型大致可以分成兩大類,一類是語言類生成模型,另一類是圖像類生成模型。語言類生成模型以ChatGPT為代表,如前所述其語言模型不僅可以學習理解用戶指令的意義(例如,“寫一首詩,李白風格的”),而且在經(jīng)過海量數(shù)據(jù)訓練之后,還能夠根據(jù)用戶的指令生成相關(guān)的文字(在上例中就是寫一首李白風格的詩)。這意味著ChatGPT需要有一個足夠大的語言模型(Large Language Model,LLM)來理解用戶的語言,并且能有高質(zhì)量的語言輸出——例如該模型必須能理解如何生成詩歌,如何生成李白風格的詩歌等等。這也意味著語言類生成式人工智能中的大語言模型需要非常多的參數(shù),才能完成這類復雜的學習并且記住如此多的信息。以ChatGPT為例,其參數(shù)量高達1750億(使用標準浮點數(shù)的話會占用700GB的存儲空間),其語言模型之“大”可見一斑。

4170e8ae-ae64-11ed-bfe3-dac502259ad0.png

ChatGPT生成回答的一個例子,支持中文另一類生成類模型是以擴散模型(Diffusion)為代表的圖像類生成模型,典型的模型包括來自OpenAI的Dalle,谷歌的ImaGen,以及目前最熱門的來自Runway AI的Stable Diffusion。這類圖像類生成模型同樣會使用一個語言模型來理解用戶的語言指令,之后根據(jù)這個指令來生成高質(zhì)量的圖像。與語言類生成模型不同的是,這里使用到的語言模型主要用語理解用戶輸入,而無需生成語言輸出,因此參數(shù)量可以小不少(在幾億數(shù)量級),而圖像的擴散模型的參數(shù)量相對而言也不大,總體而言參數(shù)量大約在幾十億數(shù)量級,但是其計算量并不小,因為生成的圖像或者視頻的分辨率可以很高。 圖像生成模型生成的圖像一例生成類模型通過海量數(shù)據(jù)訓練,可以產(chǎn)生前所未有的高質(zhì)量輸出,目前已經(jīng)有了不少明確的應用市場,包括搜索、對話機器人、圖像生成和編輯等等,未來可望會得到更多的應用,這也對于相關(guān)的芯片提出了需求。
生成類模型對于芯片的需求如前所述,以ChatGPT為代表生成類模型需要在海量的訓練數(shù)據(jù)中進行學習,才能實現(xiàn)高質(zhì)量的生成輸出。為了支持高效率訓練和推理,生成類模型對于相關(guān)芯片也有自己的需求。首先就是對于分布式計算的需求。ChatGPT這類語言類生成模型的參數(shù)量高達千億,幾乎不可能使用單機訓練和推理,而必須大量使用分布式計算。在進行分布式計算時,對于機器之間的數(shù)據(jù)互聯(lián)帶寬,以及計算芯片對于這類分布式計算(例如RDMA)就有了很大的需求,因為很多時候任務的瓶頸可能并不在計算,而是在數(shù)據(jù)互聯(lián)上面,尤其是在此類大規(guī)模分布式計算中,芯片對于分布式計算的高效率支持更加成為了關(guān)鍵。其次是內(nèi)存容量和帶寬。雖然對于語言類生成模型分布式訓練和推理不可避免,但是每個芯片的本地內(nèi)存和帶寬也將很大程度上決定單個芯片的執(zhí)行效率(因為每個芯片的內(nèi)存都被使用到了極限)。對于圖像類生成模型來說,可以把模型(20GB左右)都放在芯片的內(nèi)存中,但是隨著未來圖像生成類模型的進一步演進,它對于內(nèi)存的需求可能也會進一步提升。在這個角度來看,以HBM為代表的超高帶寬內(nèi)存技術(shù)將會成為相關(guān)加速芯片的必然選擇,同時生成類模型也會加速HBM內(nèi)存進一步增大容量和增大帶寬。除了HBM之外,CXL等新的存儲技術(shù)加上軟件的優(yōu)化也有將在這類應用中增加本地存儲的容量和性能,估計會從生成類模型的崛起中獲得更多的工業(yè)界采用。最后是計算,無論是語言類還是圖像類生成類模型的計算需求都很大,而圖像類生成模型隨著生成分辨率越來越高以及走向視頻應用,對于算力的需求可能會大大提升——目前的主流圖像生成模型的計算量在20 TFlops左右,而隨著走向高分辨率和圖像,100-1000 TFLOPS的算力需求很有可能會是標準。

綜上所述,我們認為生成類模型對于芯片的需求包括了分布式計算,存儲以及計算,可謂是涉及了芯片設計的方方面面,而更重要的是如何把這些需求都以合理的方法結(jié)合到一起來確保某一個單獨的方面不會成為瓶頸,這也將會成為一個芯片設計系統(tǒng)工程的問題。


GPU和新AI芯片,誰更有機會生成式模型對于芯片有了新的需求,對于GPU(以Nvidia和AMD為代表)和新AI芯片(以Habana,GraphCore為代表),誰更有機會能抓住這個新的需求和市場?首先,從語言類生成模型來看,由于參數(shù)量巨大,需要很好的分布式計算支持,因此目前在這類生態(tài)上已經(jīng)有完整布局的GPU廠商更有優(yōu)勢。這是一個系統(tǒng)工程問題,需要完整的軟件和硬件解決方案,而在這個方面,Nvidia已經(jīng)結(jié)合其GPU推出了Triton解決方案。Triton支持分布式訓練和分布式推理,可以把一個模型分成多個部分到不同的GPU上去處理,從而解決參數(shù)量過大一個GPU的主存無法容納的問題。未來無論是直接使用Triton,還是在Triton的基礎(chǔ)上做進一步開發(fā),都是擁有完整生態(tài)的GPU更加方便一點。從計算上來看,由于語言類生成模型的主要計算就是矩陣計算,而矩陣計算本身就是GPU的強項,因此從這一點來看新的AI芯片相比GPU的優(yōu)勢并不明顯。從圖像類生成模型來看,這類模型的參數(shù)量雖然也很大但是比語言類生成模型要小一到兩個數(shù)量級,此外其計算中還是會大量用到卷積計算,因此在推理應用中,如果能做非常好的優(yōu)化的話,AI芯片可能有一定機會。這里的優(yōu)化包括大量的片上存儲來容納參數(shù)和中間計算結(jié)果,對于卷積以及矩陣運算的高效支持等。總體來說,目前這一代AI芯片在設計的時候主要針對的是更小的模型(參數(shù)量在億級別,計算量在1TOPS級別),而生成模型的需求相對而言還是比原來的設計目標要大不少。GPU在設計時以效率為代價換取了更高的靈活度,而AI芯片設計則是反其道而行之,追求目標應用的效率,因此我們認為在未來一兩年內(nèi),GPU仍將會在此類生成式模型加速中獨占鰲頭,但是隨著生成式模型設計更加穩(wěn)定,AI芯片設計有時間能追趕上生成式模型的迭代后,AI芯片有機會從效率的角度在生成式模型領(lǐng)域超越GPU。

END

歡迎加入Imagination GPU與人工智能交流2群41e757b4-ae64-11ed-bfe3-dac502259ad0.jpg入群請加小編微信:eetrend89

(添加請備注公司名和職稱)

推薦閱讀 對話Imagination中國區(qū)董事長:以GPU為支點加強軟硬件協(xié)同,助力數(shù)字化轉(zhuǎn)型【有獎下載】IMG DXT GPU 讓光線追蹤觸手可及4200b970-ae64-11ed-bfe3-dac502259ad0.png Imagination Technologies是一家總部位于英國的公司,致力于研發(fā)芯片和軟件知識產(chǎn)權(quán)(IP),基于Imagination IP的產(chǎn)品已在全球數(shù)十億人的電話、汽車、家庭和工作 場所中使用。獲取更多物聯(lián)網(wǎng)、智能穿戴、通信汽車電子、圖形圖像開發(fā)等前沿技術(shù)信息,歡迎關(guān)注 Imagination Tech!

原文標題:ChatGPT需要怎樣的芯片?

文章出處:【微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • imagination
    +關(guān)注

    關(guān)注

    1

    文章

    617

    瀏覽量

    63119

原文標題:ChatGPT需要怎樣的芯片?

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    你知道板卡廠商參與芯片研發(fā)的α階段意味著什么?

    大家都知道芯片很重要,但你是否知道一顆芯片從設計構(gòu)思到最終量產(chǎn),需要經(jīng)歷怎樣一個漫長的過程嗎?
    的頭像 發(fā)表于 09-24 17:08 ?7313次閱讀
    你知道板卡廠商參與<b class='flag-5'>芯片</b>研發(fā)的α階段意味著什么?

    報警芯片怎樣選擇?報警器用的什么芯片?報警芯片的主要類型?常見報警芯片推薦?防盜器芯片有哪些?

    選擇報警芯片時,需要根據(jù)具體的應用場景、功能需求、成本預算和性能要求進行綜合評估。以下是選擇報警芯片需要考慮的幾個關(guān)鍵因素,幫助你做出更合適的選擇:
    的頭像 發(fā)表于 09-22 18:55 ?238次閱讀
    報警<b class='flag-5'>芯片</b><b class='flag-5'>怎樣</b>選擇?報警器用的什么<b class='flag-5'>芯片</b>?報警<b class='flag-5'>芯片</b>的主要類型?常見報警<b class='flag-5'>芯片</b>推薦?防盜器<b class='flag-5'>芯片</b>有哪些?

    半導體芯片需要做哪些測試

    首先我們需要了解芯片制造環(huán)節(jié)做?款芯片最基本的環(huán)節(jié)是設計->流片->封裝->測試,芯片成本構(gòu)成?般為人力成本20%,流片40%,封裝35%,測試5%(對于先進工藝,流片成本可能超過
    的頭像 發(fā)表于 05-09 10:02 ?2073次閱讀
    半導體<b class='flag-5'>芯片</b><b class='flag-5'>需要</b>做哪些測試

    芯片為什么需要晶振

    ?芯片必須使用晶振的核心原因是需要精確且穩(wěn)定的時鐘信號來同步內(nèi)部操作,確保數(shù)字電路可靠運行。?
    的頭像 發(fā)表于 04-27 13:49 ?1338次閱讀

    樹莓派遇上ChatGPT,魔法熱線就此誕生!

    盡管這種電話在幾十年前就已過時,但許多人都對旋轉(zhuǎn)撥號電話記憶猶新。這些舊電話,其實可以被改造成一個ChatGPT熱線。這個由PolluxLabs開發(fā)的項目,讓你可以將一部復古的旋轉(zhuǎn)撥號電話連接到樹莓
    的頭像 發(fā)表于 04-13 09:04 ?1.2w次閱讀
    樹莓派遇上<b class='flag-5'>ChatGPT</b>,魔法熱線就此誕生!

    和安信可Ai-M61模組對話?手搓一個ChatGPT 語音助手 #人工智能 #

    ChatGPT
    jf_31745078
    發(fā)布于 :2025年03月12日 15:56:59

    OpenAI調(diào)整策略:ChatGPT審查或放寬

    近日,OpenAI宣布了一項新政策,旨在改變其訓練人工智能模型的方式,以明確支持“知識自由”,無論話題多么具有挑戰(zhàn)性或爭議性。這一舉措預示著ChatGPT未來將能夠回答更多問題,提供更多視角,并減少
    的頭像 發(fā)表于 02-18 15:10 ?3930次閱讀

    OpenAI嘗試減少對ChatGPT的審查

    ,這一政策的實施將使得ChatGPT能夠回答更多的問題,提供更多的視角。在過去,由于審查機制的存在,ChatGPT對于一些敏感或爭議性話題往往保持沉默,不愿過多涉及。然而,隨著新政策的推行,ChatGPT將逐漸減少對這類話題的回
    的頭像 發(fā)表于 02-17 14:42 ?3667次閱讀

    ChatGPT Plus 2025新功能搶先看:如何訂閱與使用全攻略

    您是否想了解2025年ChatGPT Plus的強大功能以及如何輕松訂閱?本文將為您深度剖析ChatGPT Plus的核心功能、獨特優(yōu)勢,并提供詳細的訂閱教程。 一、基礎(chǔ)功能再進化:更智能、更流暢
    的頭像 發(fā)表于 02-13 19:59 ?2076次閱讀

    OpenAI免費開放ChatGPT搜索功能

    的優(yōu)勢。它能夠以更快的速度抓取網(wǎng)絡信息,實現(xiàn)分鐘級別的內(nèi)容解析。這對于股票、體育、財經(jīng)等需要迅速獲取最新新聞內(nèi)容的行業(yè)來說,無疑是一個巨大的福音。用戶能夠第一時間掌握行業(yè)動態(tài),做出更加明智的決策。 此外,ChatGPT搜索還借助了大模型的能力
    的頭像 發(fā)表于 02-06 14:35 ?830次閱讀

    怎樣判斷芯片TMDS141工作是否正常?

    怎樣判斷芯片TMDS141 工作正常
    發(fā)表于 01-10 07:35

    OpenAI更新macOS ChatGPT應用,推出“代理”功能實現(xiàn)無縫集成

    OpenAI近日宣布,針對macOS平臺的ChatGPT應用程序迎來重大更新,此次更新引入了與多種筆記和編碼應用程序的無縫集成功能,極大地提升了用戶體驗和工作效率。 此次更新的核心亮點在于“代理
    的頭像 發(fā)表于 01-02 10:49 ?965次閱讀

    OpenAI桌面版ChatGPT新增應用協(xié)作功能

    近日,OpenAI宣布了一項重要更新,為桌面版ChatGPT推出了“與應用協(xié)作”(Work With Apps)功能。這一新功能旨在支持原生應用程序的自動化協(xié)作,為用戶帶來更加高效和便捷
    的頭像 發(fā)表于 12-23 10:52 ?946次閱讀

    ChatGPT深度融入蘋果Mac軟件生態(tài)

    近日,科技界迎來了一項重要更新。當?shù)貢r間12月19日,OpenAI宣布了一項重大進展,其研發(fā)的ChatGPT已深度集成于蘋果Mac電腦的操作系統(tǒng)軟件中,為用戶帶來了全新的使用體驗。 此次更新中
    的頭像 發(fā)表于 12-23 10:50 ?1023次閱讀

    ChatGPT新增實時搜索與高級語音功能

    在OpenAI的第八天技術(shù)分享直播中,ChatGPT的搜索功能迎來了重大更新。此次更新不僅豐富了ChatGPT的功能體系,更提升了其實用性和競爭力。 新增的實時搜索功能,是此次更新的亮點之一
    的頭像 發(fā)表于 12-17 14:08 ?940次閱讀