AI基準(zhǔn)大戰(zhàn)已經(jīng)開(kāi)始。
5月2日,由各大領(lǐng)先的科技公司和大學(xué)組成的團(tuán)隊(duì)發(fā)布了一款基準(zhǔn)測(cè)量工具的雛形——MLPerf,其目的是測(cè)量各種AI框架和芯片中不同機(jī)器學(xué)習(xí)任務(wù)的訓(xùn)練速度和推理時(shí)間。
在這一任務(wù)的參與者中,有許多知名公司和大學(xué),其中既有谷歌、英特爾、百度、AMD這樣的巨頭,也有一些AI硬件創(chuàng)企,例如SambaNova和Wave Computing。同時(shí)還有世界頂尖大學(xué):斯坦福大學(xué)、哈佛大學(xué)、加州大學(xué)伯克利分校、明尼蘇達(dá)大學(xué)和多倫多大學(xué)。
MLPerf的誕生是小部分公司自我組織進(jìn)行產(chǎn)品對(duì)比的結(jié)果。上周,RiseML的博客對(duì)比了谷歌的TPUv2和NVIDIA V100的性能。5月4日,英特爾發(fā)表博客,展示了為機(jī)器翻譯所用的RNN的數(shù)據(jù),題目稱“英特爾Xeon大規(guī)模處理器表現(xiàn)出令人驚訝的推理性能”。這種對(duì)比會(huì)給人一些參考,但通常也會(huì)讓人覺(jué)得供應(yīng)商自認(rèn)為比其他廠商優(yōu)越。而一個(gè)標(biāo)準(zhǔn)化的基準(zhǔn)可以讓測(cè)試簡(jiǎn)單化,得到人們想要的結(jié)果。
除此之外,想要跟蹤記錄各大公司和創(chuàng)企的芯片制造以及軟件更新是非常困難的,更不要說(shuō)在市場(chǎng)的夸大作用下還能進(jìn)行真實(shí)評(píng)估了。某些芯片廠商經(jīng)常承諾達(dá)到了革命性的提速,但從來(lái)不透露產(chǎn)品規(guī)格(咳咳,英特爾注意)。
在很長(zhǎng)一段時(shí)間內(nèi),人們都在討論是否有必要設(shè)立一個(gè)有意義的AI基準(zhǔn)。支持者認(rèn)為,標(biāo)準(zhǔn)的缺失限制了AI的應(yīng)用。MLPerf的推動(dòng)者之一吳恩達(dá)表示:“AI正在改變多個(gè)行業(yè),但是為了發(fā)揮它最大的潛能,我們?nèi)孕枰斓挠布蛙浖!敝С终邆兿M鶞?zhǔn)的確立能幫助AI開(kāi)發(fā)者創(chuàng)造出更好的產(chǎn)品,讓使用者充分了解所需產(chǎn)品。
MLPerf聲明它的基礎(chǔ)目標(biāo)是:
用公平、有幫助的測(cè)量方法加速機(jī)器學(xué)習(xí)的發(fā)展
對(duì)各競(jìng)爭(zhēng)系統(tǒng)進(jìn)行公平對(duì)比,以鼓勵(lì)機(jī)器學(xué)習(xí)的發(fā)展
保證讓所有人都能參與基準(zhǔn)評(píng)比
既服務(wù)于商業(yè)群體,也服務(wù)于研究領(lǐng)域
基準(zhǔn)要可復(fù)制,確保結(jié)果的可靠
MLPerf是仿效過(guò)去其他的基準(zhǔn)測(cè)試,例如SPEC(The Standard Performance Evaluation Corporation)。該基準(zhǔn)于1988年由一家計(jì)算公司的財(cái)團(tuán)提出,它有效提高了通用計(jì)算的速度。而MLPerf結(jié)合了此前許多基準(zhǔn)的標(biāo)準(zhǔn),例如SPEC的程序,SORT用于對(duì)比和培育新思想的方法,DeepBench對(duì)軟件應(yīng)用的評(píng)估,以及DAWNBench的精確度標(biāo)準(zhǔn)。
Intersect360的CEO Addison Snell注意到:“現(xiàn)在許多企業(yè)都想部署AI,所以推出一套中立的基準(zhǔn)非常重要,尤其在多種技術(shù)爭(zhēng)相競(jìng)爭(zhēng)的時(shí)代。但是,AI領(lǐng)域多種多樣,我不禁懷疑是否最后只剩一種標(biāo)準(zhǔn)。想想五年前人們對(duì)大數(shù)據(jù)和分析的熱情,盡管人人都想定義它,但是至今也沒(méi)有一個(gè)通用的衡量標(biāo)準(zhǔn)。我認(rèn)為AI也會(huì)面臨這種情況?!?/p>
Hyperion研究公司的高級(jí)研究副總裁Steve Conway認(rèn)為:“MLPerf是一款有用、優(yōu)秀的工具。因?yàn)榻┠暌恢比鄙籴槍?duì)買賣雙方的真正標(biāo)準(zhǔn)。這個(gè)基準(zhǔn)似乎是針對(duì)人工智能早期問(wèn)題指定的,大多都是有邊界問(wèn)題。后來(lái)我們需要其他標(biāo)準(zhǔn),因?yàn)槿斯ぶ悄荛_(kāi)始出現(xiàn)了無(wú)邊界的問(wèn)題。有邊界的問(wèn)題比較簡(jiǎn)單,如語(yǔ)音、圖像識(shí)別或游戲。而無(wú)界線問(wèn)題包括癌癥診斷和閱讀磁核共振報(bào)告;現(xiàn)在,人工智能能為復(fù)雜問(wèn)題提出推薦方案了。“
MLPerf現(xiàn)已在GitHub上發(fā)布,但仍處于初期階段,為α版本,未來(lái)將在許多方面得到改進(jìn)。目前,MLPerf套件上能進(jìn)行測(cè)試的有七個(gè)方面:

每個(gè)參考都提供了以下內(nèi)容:至少在一個(gè)框架中實(shí)現(xiàn)模型的代碼;一個(gè)可在container中運(yùn)行基準(zhǔn)測(cè)試的Dockerfile;一個(gè)可下載適當(dāng)數(shù)據(jù)集的腳本;一個(gè)可以運(yùn)行并計(jì)時(shí)模型訓(xùn)練的腳本;數(shù)據(jù)集、模型和機(jī)器設(shè)置的文檔記錄。
根據(jù)GitHub上的記錄,基準(zhǔn)測(cè)試已經(jīng)在以下配置中進(jìn)行測(cè)試:
16個(gè)CPU,一個(gè)NVIDIA P100
Ubuntu 16.04,包括具有NVIDIA支持的docker
600GB的硬盤(盡管很多基準(zhǔn)要求的硬盤更?。?/p>
在這樣一個(gè)年輕的市場(chǎng),如果有更多的AI基準(zhǔn)出現(xiàn),那將變得很有趣。例如,斯坦福大學(xué)是MLPerf的其中一個(gè)成員,他最近運(yùn)行了第一個(gè)DAWNBenchv1深度學(xué)習(xí)結(jié)果。
斯坦福報(bào)道說(shuō):“2018年4月20日表示第一個(gè)衡量深度學(xué)習(xí)端到端性能的基準(zhǔn)和競(jìng)爭(zhēng)的開(kāi)始:測(cè)量深度學(xué)習(xí)任務(wù)達(dá)到最佳精確度時(shí)所需要的時(shí)間和成本是多少,以及在這個(gè)最先進(jìn)的精確度水平下進(jìn)行推理的成本是多少。對(duì)端到端性能的關(guān)注提供了一種客觀的方法,用于對(duì)計(jì)算框架、硬件、優(yōu)化算法、超參數(shù)設(shè)置以及影響性能的其他因素進(jìn)行標(biāo)準(zhǔn)化?!?/p>
DAWN的一個(gè)競(jìng)爭(zhēng)對(duì)手——fast.ai(一家提供人工智能培訓(xùn)和開(kāi)發(fā)人工智能軟件工具的初創(chuàng)公司)在HPCwire上宣傳它的產(chǎn)品性能。所以這些基準(zhǔn)很重要,應(yīng)該認(rèn)真對(duì)待,像MLPerf這樣的工具能幫助清除AI產(chǎn)品對(duì)比中的干擾因素。
“基準(zhǔn)提高了產(chǎn)品可信度,并展示了更好的性能或能帶來(lái)更多益處的地方。如果你正在考慮為一個(gè)數(shù)百萬(wàn)美元的項(xiàng)目使用硬件加速器或軟件框架,那么你會(huì)不會(huì)更喜歡’榜上有名’的產(chǎn)品?”谷歌工程師Peter Mattson表示。
MLPerf希望用可復(fù)制的、公平可靠的基準(zhǔn)測(cè)量方法來(lái)推動(dòng)機(jī)器學(xué)習(xí)行業(yè)和研究的發(fā)展。產(chǎn)品之間的對(duì)比還應(yīng)促進(jìn)供應(yīng)商和學(xué)者之間的競(jìng)爭(zhēng)。同時(shí)還應(yīng)該為沒(méi)人提供做實(shí)驗(yàn)的條件,讓更多人參與其中。
Mattson補(bǔ)充道:“基準(zhǔn)在短期內(nèi)很重要,因?yàn)椴还苁菍?duì)研發(fā)公司還是想要購(gòu)買產(chǎn)品的公司來(lái)說(shuō),硬件是一項(xiàng)巨大的投資。長(zhǎng)期來(lái)看,基準(zhǔn)有助于研究者和供應(yīng)商將性能作為共同的發(fā)展目標(biāo),這樣才能解鎖更多機(jī)器學(xué)習(xí)的能量,造福更多人。”
-
AI
+關(guān)注
關(guān)注
91文章
41026瀏覽量
302549 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
67文章
8562瀏覽量
137208 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5604瀏覽量
124612 -
MLPerf
+關(guān)注
關(guān)注
0文章
37瀏覽量
981
原文標(biāo)題:MLPerf——機(jī)器學(xué)習(xí)新基準(zhǔn)能否驅(qū)動(dòng)AI向前?
文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
解析AD8582:一款高性能雙12位DAC的深度剖析
AD7713:一款強(qiáng)大的信號(hào)調(diào)理 ADC 的深度剖析
AD7607:一款高性能8通道DAS的深度解析
SGM431VBQ:汽車級(jí)精密可編程電壓基準(zhǔn)的卓越之選
深度解析TMP401:一款強(qiáng)大的數(shù)字溫度傳感器
TSM103W:一款多功能雙運(yùn)放與電壓基準(zhǔn)芯片的深度解析
[工具討論] 如果有一款國(guó)產(chǎn)圖形化配置工具STM32Cube,支持所有內(nèi)核和廠商MCU,你會(huì)用嗎?
Postman:一款被忽視的強(qiáng)大的API開(kāi)發(fā)和測(cè)試工具
靈動(dòng)微電子最新最火熱的一款芯片推薦
關(guān)于“實(shí)時(shí)基準(zhǔn)對(duì)比測(cè)量”與AI再探討
是德示波器MSOX2024A時(shí)間基準(zhǔn)穩(wěn)定性的測(cè)試方法
登頂!華為OceanStor A系列存儲(chǔ)再登MLPerf全球性能之巔
如何正確使用是德示波器MSOX3054T進(jìn)行高速信號(hào)測(cè)量
一款基準(zhǔn)測(cè)量工具的雛形——MLPerf
評(píng)論