在將其Grace Hopper芯片直接與量子處理器集成,并在經(jīng)典超級(jí)計(jì)算機(jī)上展示模擬量子系統(tǒng)的能力之間,英偉達(dá)本月在量子計(jì)算領(lǐng)域掀起了波瀾。
英偉達(dá)當(dāng)然已經(jīng)做好了利用后者的準(zhǔn)備。它制造了超級(jí)計(jì)算機(jī)使用的GPU,與人工智能開(kāi)發(fā)人員渴望的GPU相同。這些GPU作為在經(jīng)典計(jì)算機(jī)上模擬數(shù)十個(gè)量子位的工具也很有價(jià)值。新的軟件開(kāi)發(fā)意味著研究人員現(xiàn)在可以使用越來(lái)越多的超級(jí)計(jì)算資源來(lái)代替真正的量子計(jì)算機(jī)。
但模擬量子系統(tǒng)是一項(xiàng)要求極高的挑戰(zhàn),而這些要求就在背后若隱若現(xiàn)。
經(jīng)典計(jì)算機(jī)在模擬量子硬件方面有兩個(gè)作用。首先,量子計(jì)算機(jī)構(gòu)建者可以使用經(jīng)典計(jì)算來(lái)測(cè)試他們的設(shè)計(jì)。倫敦帝國(guó)理工學(xué)院博士后研究員Jinzhao Sun表示:“經(jīng)典模擬是理解和設(shè)計(jì)量子硬件的一個(gè)基本方面,通常是驗(yàn)證這些量子系統(tǒng)的唯一手段?!?/p>
另一方面,經(jīng)典計(jì)算機(jī)可以運(yùn)行量子算法來(lái)代替實(shí)際的量子計(jì)算機(jī)。正是這種能力讓研究分子動(dòng)力學(xué)、蛋白質(zhì)折疊和新興的量子機(jī)器學(xué)習(xí)領(lǐng)域的研究人員特別感興趣,所有這些都受益于量子處理。
經(jīng)典模擬并不是真正量子物品的完美替代品,但它們經(jīng)常制作合適的傳真。世界上只有這么多量子計(jì)算機(jī),而經(jīng)典模擬更容易訪問(wèn)。經(jīng)典模擬還可以控制困擾真實(shí)量子處理器的噪音,并經(jīng)常破壞量子運(yùn)行。紐約州厄普頓布魯克黑文國(guó)家實(shí)驗(yàn)室的計(jì)算機(jī)科學(xué)和機(jī)器學(xué)習(xí)研究員Shinjae Yoo表示,經(jīng)典模擬可能比真正的量子模擬慢,但研究人員仍然可以節(jié)省時(shí)間。
因此,捕獲是一個(gè)大小問(wèn)題。由于量子系統(tǒng)中的一個(gè)量子位與該系統(tǒng)中的其他量子位糾纏在一起,因此精確模擬該系統(tǒng)的需求呈指數(shù)級(jí)增長(zhǎng)。根據(jù)經(jīng)驗(yàn),每增加一個(gè)量子位,模擬所需的經(jīng)典內(nèi)存量就會(huì)增加一倍。從單個(gè)GPU移動(dòng)到整個(gè)八個(gè)GPU節(jié)點(diǎn)需要增加三個(gè)量子位。
許多研究人員仍然夢(mèng)想著在這個(gè)指數(shù)斜率上盡可能地向上推進(jìn)。Yoo說(shuō):“如果我們正在進(jìn)行分子動(dòng)力學(xué)模擬,我們希望有更大數(shù)量的原子和更大規(guī)模的模擬,以獲得更真實(shí)的模擬?!?/p>
GPU可以加速量子模擬
GPU是關(guān)鍵的立足點(diǎn)。Yoo說(shuō),用GPU換CPU可以將量子系統(tǒng)的模擬速度提高一個(gè)數(shù)量級(jí)。這種加速可能并不令人驚訝,但由于GPU之間發(fā)送信息的瓶頸,很少有模擬能夠充分利用這一優(yōu)勢(shì)。因此,大多數(shù)模擬都停留在一個(gè)多GPU節(jié)點(diǎn)甚至該節(jié)點(diǎn)內(nèi)的單個(gè)GPU的范圍內(nèi)。
一些幕后的進(jìn)展使緩解這些瓶頸成為可能。英偉達(dá)的cuQuantum軟件開(kāi)發(fā)套件使研究人員更容易在多個(gè)GPU上運(yùn)行量子模擬。GPU以前需要通過(guò)CPU進(jìn)行通信,這造成了額外的瓶頸——像Nvidia的NCCL這樣的集體通信框架允許用戶(hù)直接在節(jié)點(diǎn)之間進(jìn)行內(nèi)存到內(nèi)存的復(fù)制等操作。
cuQuantum與加拿大初創(chuàng)公司Xanadu的PennyLane等量子計(jì)算工具包配對(duì)。作為量子機(jī)器學(xué)習(xí)社區(qū)的堅(jiān)定支持者,PennyLane讓研究人員在量子計(jì)算機(jī)上使用PyTorch等技術(shù)。雖然PennyLane是為在真正的量子硬件上使用而設(shè)計(jì)的,但PennyLanne的開(kāi)發(fā)人員特別添加了在多個(gè)GPU節(jié)點(diǎn)上運(yùn)行的功能。
從理論上講,這些進(jìn)步可以讓經(jīng)典計(jì)算機(jī)模擬大約36個(gè)量子位。在實(shí)踐中,這種規(guī)模的模擬需要太多的節(jié)點(diǎn)小時(shí)才能實(shí)現(xiàn)。如今更現(xiàn)實(shí)的金本位是20s。盡管如此,這比幾年前研究人員所能模擬的還要多出10個(gè)量子位。
也就是說(shuō),Yoo在Perlmutter超級(jí)計(jì)算機(jī)上工作,這臺(tái)超級(jí)計(jì)算機(jī)是由數(shù)千個(gè)Nvidia A100 GPU構(gòu)建的,旨在培養(yǎng)和運(yùn)行人工智能模型的能力,即使在中國(guó),這些模型的銷(xiāo)售也受到美國(guó)政府出口管制的限制。西方相當(dāng)多的其他超級(jí)計(jì)算機(jī)使用A100作為支柱。
經(jīng)典硬件在qbit仿真中的作用
經(jīng)典硬件的規(guī)模能否繼續(xù)增長(zhǎng)?挑戰(zhàn)是巨大的。從擁有160G GPU內(nèi)存的英偉達(dá)DGX到擁有320GB GPU內(nèi)存的DGX,只不過(guò)是一個(gè)量子位的跳躍。Jinzhao Sun認(rèn)為,試圖模擬100多個(gè)量子位的經(jīng)典模擬很可能會(huì)失敗。
真正的量子硬件,至少在表面上,已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了這些量子位的數(shù)量。例如,IBM已經(jīng)穩(wěn)步將其通用量子處理器中的量子位數(shù)量增加到數(shù)百個(gè),并雄心勃勃地計(jì)劃將這些數(shù)量增加到數(shù)千個(gè)。
這并不意味著模擬在千量子位的未來(lái)不會(huì)發(fā)揮作用。經(jīng)典計(jì)算機(jī)可以在模擬大型系統(tǒng)的各個(gè)部分中發(fā)揮重要作用——驗(yàn)證它們的硬件或測(cè)試有朝一日可能以全尺寸運(yùn)行的算法。事實(shí)證明,使用29個(gè)量子位可以做很多事情。
審核編輯:彭菁
-
仿真
+關(guān)注
關(guān)注
54文章
4417瀏覽量
137771 -
硬件
+關(guān)注
關(guān)注
11文章
3559瀏覽量
68827 -
工具包
+關(guān)注
關(guān)注
0文章
48瀏覽量
9867 -
量子系統(tǒng)
+關(guān)注
關(guān)注
0文章
23瀏覽量
2773
原文標(biāo)題:研究人員如何使用Nvidia的GPU模擬Qubits
文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
利用 NucleiStudio IDE 和 vivado 進(jìn)行軟硬件聯(lián)合仿真
analog devices方案:在LTspice仿真中使用GaN FET模型
如何在NVIDIA Isaac Lab中使用Newton訓(xùn)練四足機(jī)器人
自動(dòng)駕駛中常提的硬件在環(huán)是個(gè)啥?
在AMD Versal自適應(yīng)SoC上使用QEMU+協(xié)同仿真示例
CST Studio Suite電磁仿真如何驅(qū)動(dòng)下一代產(chǎn)品創(chuàng)新?
羅姆新SPICE模型助力優(yōu)化功率半導(dǎo)體性能
概倫電子電路類(lèi)型驅(qū)動(dòng)SPICE仿真器NanoSpice X介紹
基于VT系統(tǒng)的MCU硬件在環(huán)建模與仿真應(yīng)用分析
大規(guī)模硬件仿真系統(tǒng)的編譯挑戰(zhàn)
對(duì)齊熱測(cè)量與仿真

經(jīng)典硬件在qbit仿真中的作用
評(píng)論