3月31日,2026國際集成電路展覽會暨研討會(IIC2026)將在上海召開。 作為全球集成電路領域最具影響力的行業(yè)盛會之一,本屆大會以“技術賦能產業(yè),生態(tài)鏈接價值”為核心定位,聚焦AI芯片、汽車電子、工業(yè)控制、通信系統、綠色能源等關鍵應用場景,匯聚全球IC設計、EDA工具、IP授權、先進封裝等領域的頂尖企業(yè)與專家,打造貫通芯片設計制造、能源技術革新、產品商業(yè)化落地的超級產業(yè)連接器。
屆時,國科微AI算法部部長倪亞宇將在“邊緣AI與算力芯片”垂直技術論壇上發(fā)表題為《Flash Attention-4:新一代大模型推理NPU流水線范式設計》的主題演講。
Flash Attention系列由Tri Dao團隊主導開發(fā),其核心哲學是IO-Aware的算法-硬件協同優(yōu)化:通過精細拆分計算任務以適配芯片的內存層次結構,將傳統注意力機制中的高開銷數據搬運,轉化為片上高效計算。該系列自2022年首次發(fā)布以來,已迭代至第四版,但即便是V1版本,在NPU平臺上的落地實踐仍面臨巨大挑戰(zhàn)。
本次演講將揭秘FlashAttention-V4如何讓算法與NPU硬件實現“默契配合”,通過流水線式的協同設計,打通訪存帶寬、存儲層級、同步機制等關鍵堵點,為國產算力平臺上的大模型推理開辟一條高效新路徑。更進一步,倪亞宇還將在演講中披露國科微新一代NPU架構——該架構支持高性能FlashAttention推理,并配套新一代工具鏈,持續(xù)夯實國科微在打造“端邊AI芯引擎”戰(zhàn)略中的技術積累。
-
集成電路
+關注
關注
5462文章
12667瀏覽量
375566 -
國科微
+關注
關注
0文章
121瀏覽量
7692 -
大模型
+關注
關注
2文章
3746瀏覽量
5266
原文標題:IIC2026演講預告 | 倪亞宇:新一代大模型推理NPU流水線范式設計
文章出處:【微信號:國科微,微信公眾號:國科微】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
億緯鋰能亮相第43屆美國國際電池研討會暨展覽會
晶科儲能亮相ESIE 2026儲能國際峰會暨展覽會
以韌為刃?向高而躍:2026國際集成電路展覽會暨研討會(IIC SHANGHAI 2026)盛大開幕 "中國IC設計成就獎&qu
極海G32R430編碼器專用MCU榮獲2026中國IC設計成就獎
芯啟源科技邀您共赴2026年莫斯科國際通信展覽會
展會邀請|瑞迅科技邀您共赴德國紐倫堡embedded world 2026國際嵌入式展覽會
國科微邀您共赴IIC 2026國際集成電路展覽會暨研討會
評論