西班牙的SemiDynamics基于其完全可定制的64位內(nèi)核開發(fā)了用于AI芯片設(shè)計的RISC-V Tensor Unit。
RISC-V Tensor 單元集成到緩存子系統(tǒng)中,SemiDynamics 使其成為第一個用于數(shù)據(jù)中心高性能 AI 芯片設(shè)計的完全一致的此類單元。
LLaMa-2 或 ChatGPT 等大型語言機器學習模型 (LLM) 使用數(shù)十億個參數(shù),需要大量計算能力。LLM 層中的大部分計算可以作為張量單元硬件中的矩陣乘法有效實現(xiàn)。
張量單元構(gòu)建在 Semidynamics RVV1.0 矢量處理單元之上,并使用現(xiàn)有的矢量寄存器來存儲矩陣。這使得張量單元可以用于需要矩陣乘法功能的層,例如全連接和卷積,并將向量單元用于激活函數(shù)層(ReLU、Sigmoid、Softmax 等),這是一個很大的改進- 單獨的 NPU 可能會與激活層作斗爭。

張量單元使用矢量單元功能以及 Atrevido-423 Gazzillion CPU 從內(nèi)存中獲取所需的數(shù)據(jù)。64 位 CPU 內(nèi)核的性能意味著不需要直接內(nèi)存訪問 (DMA) 來管理數(shù)據(jù)流。由于張量單元使用向量寄存器來存儲其數(shù)據(jù),并且不包含新的、架構(gòu)上可見的狀態(tài),因此它可以與任何支持 RISC-V 向量的 Linux 一起使用,而無需進行任何更改。
SemiDynamics 創(chuàng)始人兼首席執(zhí)行官 Roger Espasa 表示:“這個新的 Tensor Unit 旨在與我們的其他創(chuàng)新技術(shù)完全集成,以提供具有出色 AI 性能的解決方案?!?/p>
“首先,核心是我們的 64 位完全可定制的 RISC-V 內(nèi)核。然后是我們的矢量單元,它通過我們的 Gazzillion 技術(shù)不斷饋送數(shù)據(jù),因此不會丟失任何數(shù)據(jù)。然后是張量單元,它執(zhí)行人工智能所需的矩陣乘法。該解決方案的每個階段都經(jīng)過精心設(shè)計,可與其他階段完全集成,以實現(xiàn)最佳的人工智能性能和非常簡單的編程。與僅在標量核心上運行 AI 軟件相比,性能提高了 128 倍?!?/p>
Tensor Unit 將于下個月在美國舉行的 RISC-V 峰會上進行討論,作為人工智能芯片設(shè)計重點的一部分。
審核編輯:黃飛
-
寄存器
+關(guān)注
關(guān)注
31文章
5607瀏覽量
129853 -
cpu
+關(guān)注
關(guān)注
68文章
11269瀏覽量
224720 -
機器學習
+關(guān)注
關(guān)注
66文章
8551瀏覽量
136815 -
RISC-V
+關(guān)注
關(guān)注
48文章
2877瀏覽量
52806 -
AI芯片
+關(guān)注
關(guān)注
17文章
2122瀏覽量
36739
原文標題:RISC-V,進攻AI芯片
文章出處:【微信號:芯長征科技,微信公眾號:芯長征科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
RISC-V vs ARM:為什么工業(yè)與邊緣計算仍然選擇 ARM 架構(gòu)?
Renesas R9A02G021:32位RISC-V MCU的全方位解析
重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入式與 AI 領(lǐng)域落地
RISC-V B擴展介紹及實現(xiàn)
PIC64GX1000 RISC-V MPU:一款面向嵌入式計算的高性能64位多核處理器
成都華微32位RISC-V超低功耗MCU新品發(fā)布
RISC-V 手冊
燦芯半導(dǎo)體亮相2025 RISC-V中國峰會
中微愛芯RISC-V內(nèi)核32位通用MCU AiP32RV1564介紹
HPM5E31IGN單核 32 位 RISC-V 處理器
RISC-V核低功耗MCU指令集架構(gòu)(ISA)特點
FPGA與RISC-V淺談
DietPi 9.10:帶來 RISC-V 升級與樹莓派內(nèi)核遷移
基于可定制64位內(nèi)核的RISC-V設(shè)計
評論