chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

師法自然 淺談深度學(xué)習(xí)的多重角度

mK5P_AItists ? 來源:電子發(fā)燒友網(wǎng) ? 作者:工程師譚軍 ? 2018-07-10 08:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學(xué)習(xí)已經(jīng)成熟到可以教給高中生了么?

我思考的這個(gè)問題,源于不久前我收到的?封來自某大公司產(chǎn)品經(jīng)理的郵件。

我喜歡將私人通訊郵件公開于眾,所以我將郵件內(nèi)容摘在下面:

來自:M.

你好 Ali, ...

你如何訓(xùn)練團(tuán)隊(duì)里的年輕成員,使得他們有更好的直覺和預(yù)判?我團(tuán)隊(duì)里的工程師經(jīng)常從其他科研員那「借鑒」超參數(shù)的值,但他們太擔(dān)心要自己去調(diào)整參數(shù)了。...

我對(duì)著這封郵件思考了數(shù)日,卻沒有辦法找到?個(gè)有條理的答案。

如果說應(yīng)該有正確答案的話,我想回復(fù)說:也許她的工程師應(yīng)該要有這種擔(dān)心。

如果你是個(gè)工程師,你拿到了這個(gè)神經(jīng)網(wǎng)絡(luò),然后你被要求去改進(jìn)這個(gè)網(wǎng)絡(luò)在某個(gè)數(shù)據(jù)集上的表現(xiàn)。你也許會(huì)假設(shè)這每層都是有它自己的作用和功能,但在深度學(xué)習(xí)領(lǐng)域,我們目前還沒有統(tǒng)的語言和詞匯去描述這些功效。我們教授深度學(xué)習(xí)的方法和我們教授其他科學(xué)學(xué)科的方法很不同。

幾年前我迷上了光學(xué)。在光學(xué)領(lǐng)域,你會(huì)堆疊好幾層不同的組件以處理輸?shù)墓庠?。例如下圖,就是相機(jī)的鏡頭:

師法自然 淺談深度學(xué)習(xí)的多重角度

要設(shè)計(jì)這樣的系統(tǒng),你從最簡單的組件開始堆疊,這些組件往往以知名的發(fā)明者命名。然后通過仿真,你可 以判斷你的設(shè)計(jì)是否符合你的要求,然后再添加不同的組件去修正先前設(shè)計(jì)的缺陷。

緊接著你會(huì)各種數(shù)學(xué)優(yōu)化過程去調(diào)整這些組件的參數(shù),例如鏡面的形狀、位置和傾斜角度等等,去最大程度實(shí)現(xiàn)你的設(shè)計(jì)目標(biāo)。你就重復(fù)如此仿真、修改、調(diào)優(yōu)的過程。

這很像我們設(shè)計(jì)深度網(wǎng)絡(luò)的過程。

上圖里所有的 36 個(gè)元素都是故意加?這個(gè)堆疊的系統(tǒng),以用于修正某項(xiàng)具體的偏差的。這樣的設(shè)計(jì)需要非常精確的解釋模型去描述什么樣的元素能夠?qū)ν高^它的光有什么樣的效應(yīng)。這個(gè)模型往往是關(guān)于這個(gè)元素的作用的,例如說折射、反射、衍射、散射和波前校正。

師法自然 淺談深度學(xué)習(xí)的多重角度

?們不害怕這樣的設(shè)計(jì)過程。每年,美國培養(yǎng)的許多?程師都能設(shè)計(jì)出有的鏡頭,他們并不為這樣的作感到擔(dān)心害怕。

這并不是因?yàn)楣鈱W(xué)很容易,而是因?yàn)槲覀儗?duì)光學(xué)的模型了然在心。

現(xiàn)代光學(xué)是通過抽象出不同層級(jí)的知識(shí)內(nèi)容去教授的。

師法自然 淺談深度學(xué)習(xí)的多重角度

在最頂級(jí),也是最容易的層級(jí),是幾何光學(xué)。幾何光學(xué)是對(duì)波光學(xué)的抽象,光射線于于表達(dá)簡單的矢量波光 學(xué)的波前矢量。而波光學(xué)?是對(duì)麥克斯韋方程的進(jìn)?步簡化。麥克斯韋方程 由能由量子力學(xué)推導(dǎo)而出,量子力學(xué)則超出了我的理解范圍。

每?個(gè)層級(jí)都是通過作出?些簡化的假定由緊鄰的下?個(gè)層級(jí)推導(dǎo)?出,所以每?個(gè)層級(jí)能夠比上?個(gè)層級(jí)解釋更為復(fù)雜的現(xiàn)象。

師法自然 淺談深度學(xué)習(xí)的多重角度

我花了不少時(shí)間在頂四層抽象里設(shè)計(jì)系統(tǒng)。

這就是當(dāng)今我們教授光學(xué)的方法。但相關(guān)理論并非總是如此按層級(jí)來組織。在百年前,這些理論還是在?個(gè) 相互矛盾的狀態(tài)中共存。實(shí)踐家們只能依賴于近乎道聽途說的光學(xué)理論。

但這并沒有阻止伽利略打造性能不錯(cuò)的望遠(yuǎn)鏡,而且是在牛頓形式化幾何光學(xué)前近?個(gè)世紀(jì)的時(shí)間點(diǎn)上。因 為伽利略對(duì)于如何造出能夠放大數(shù)?倍的望遠(yuǎn)鏡有足夠好的解釋模型。但他對(duì)光學(xué)的理解,卻不足以讓他的望遠(yuǎn)鏡能夠修正色差或者獲得廣視角。

在這些光學(xué)理論被抽象總結(jié)出來之前,每?項(xiàng)理論都需要從光的最基本概念出發(fā)。這就牽涉到要作出?套涵蓋許多也許不切實(shí)際的假設(shè)。牛頓的幾何光學(xué)把光假定作?束束可以被吸引、排斥的固體粒??;莞箘t? 由「以太」作為介質(zhì)的縱波去描述光,也就是說用類似聲波的方式去構(gòu)建光。麥克斯韋也假設(shè)光經(jīng)由以太傳播。你從麥克斯韋方程的系數(shù)的名字也能窺得這種思路的??。

愚蠢的模型,確實(shí)。但它們可量化且有預(yù)測的能力。

這些假設(shè),我們今天聽來也許覺得很愚蠢,但它們可量化而且有預(yù)測的能力。你可以隨意代入數(shù)字于其中并得到精準(zhǔn)的量化預(yù)測。這對(duì)于工程師而言極其有用。

尋找用于描述每層深度學(xué)習(xí)網(wǎng)絡(luò)作用的模塊化語言

如果我們能夠像討論光纖穿越每?層鏡頭元素的作用那樣去討論神經(jīng)網(wǎng)絡(luò)每?層的作用,那么設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)將會(huì)變得更容易。

我們說卷積層就像在輸?上滑動(dòng)相應(yīng)濾波器,然后說池化是處理了對(duì)應(yīng)的非線性。但這只是非常低層次的描述,就像用麥克斯韋方程去解釋鏡頭的作用。

也許我們應(yīng)該依賴于更高級(jí)抽象描述,具體表達(dá)某個(gè)量被神經(jīng)網(wǎng)絡(luò)的層級(jí)如何改變了,好比我們用鏡頭的具 體作用去解釋它如何彎曲光線那樣。

如果這種抽象也能夠量化,使得你只需要代?具體數(shù)值到某個(gè)公式里,它就能告訴你?個(gè)大概的量化分析,這樣你就能更好地設(shè)計(jì)你的網(wǎng)絡(luò)了。

我們離這樣的語言還很遠(yuǎn)。我們先從簡單點(diǎn)的開始

上?也許只是我被自己的幻想帶跑了。

我們從簡單點(diǎn)的開始。我們對(duì)深度學(xué)習(xí)的運(yùn)作方式有很多解釋模型。下?我會(huì)羅列?系列值得解釋的現(xiàn)象,然后我們看看?些現(xiàn)有的模型對(duì)這些現(xiàn)象解釋的能力有多強(qiáng)。

在開始之前,我得承認(rèn)這種努力也許最后是徒勞的。光學(xué)花了 300 年在打磨自己的模型之上,而我只花了? 個(gè)周六下午,所以這只能算是博客上的?些個(gè)?觀點(diǎn)和想法。

現(xiàn)象:隨機(jī)梯度下降 (SGD) 的隨機(jī)初始化足夠好了。但細(xì)微的數(shù)字錯(cuò)誤或者步長會(huì)使 SGD 失效。

很多?在實(shí)踐中發(fā)現(xiàn),對(duì)于如何累積梯度的細(xì)微調(diào)整,可以導(dǎo)致對(duì)整個(gè)測試集表現(xiàn)的巨大變化。例如說你只用GPU而不是 CPU 去訓(xùn)練,結(jié)果可能會(huì)截然不同。

現(xiàn)象:淺的局部最優(yōu)值意味著比深的局部最優(yōu)值更好的泛化能力。

這種說法很時(shí)髦。有些?認(rèn)為它是真的。有些?則用實(shí)際數(shù)據(jù)反駁。另外也有?給出了這個(gè)現(xiàn)象的變種 。眾說紛紜,爭議目前不斷。

這個(gè)現(xiàn)象也許有爭議性,但我還是先放在這里。

現(xiàn)象:批標(biāo)準(zhǔn)化層 (Batch Norm) 可以給 SGD 提速。

這個(gè)基本無爭議,我只能提供?個(gè)小例外。

現(xiàn)象:即使有很多局部最優(yōu)和鞍點(diǎn),SGD 也表現(xiàn)卓越。

這個(gè)說法也包含了幾個(gè)小的點(diǎn)。經(jīng)常有人聲稱深度學(xué)習(xí)的損失表面充斥著鞍點(diǎn)和局部最優(yōu)。也有不同的 說法,要不就認(rèn)為梯度下降可以遍歷這些區(qū)域,要不就認(rèn)為梯度下降可以不遍歷這些區(qū)域,但都能給出泛化能力不錯(cuò)的答案。也有說損失表面其實(shí)也沒那么不堪。

現(xiàn)象:Dropout 勝于其他隨機(jī)化策略。

我不知道如何正確分類類似 Dropout 的做法,所以我就稱之為「隨機(jī)化策略」了。

現(xiàn)象:深度網(wǎng)絡(luò)能夠記憶隨機(jī)標(biāo)簽,但它們能泛化。

證據(jù)很直白,我的朋友們親自見證并主張這種說法。

對(duì)這些現(xiàn)象的解釋

對(duì)應(yīng)上面列舉的這些現(xiàn)象,我在下面列舉我覺得最能解釋這些現(xiàn)象的理論,這些理論均來自我上面引用的論文。

師法自然 淺談深度學(xué)習(xí)的多重角度

先別激動(dòng),原因如下:

1. 我們嘗試解釋的這些現(xiàn)象部分有爭議。

2. 我沒辦法把這些解釋按照抽象層級(jí)組織好。光學(xué)好教學(xué)的特性也沒辦法在這?重現(xiàn)。

3. 我懷疑部分我引用的理論不正確。

我想說的是

有很多人正在加?這個(gè)領(lǐng)域,然而我們能夠給他們傳授的不過是近乎道聽途說的經(jīng)驗(yàn)和?些預(yù)訓(xùn)練好的深度網(wǎng)絡(luò),然后就叫他們?nèi)ダ^續(xù)創(chuàng)新。我們甚?都不能認(rèn)同我們要解釋的這些現(xiàn)象。所以我認(rèn)為我們離能夠在高中教授這些內(nèi)容還有很遠(yuǎn)的距離。

那我們?nèi)绾尾拍茈x這?步近點(diǎn)?

最好的不過是我們能夠就每?層深度網(wǎng)絡(luò)的功能作用,按照不同層級(jí)的抽象,給出對(duì)應(yīng)的解釋模型。例如 說,神經(jīng)網(wǎng)絡(luò)里的折射、散射和衍射會(huì)是怎么樣的?也許你早就用具體的功能去思考神經(jīng)網(wǎng)絡(luò),但我們就這些概念還沒有統(tǒng)?的語言。

我們應(yīng)該把?系列確認(rèn)的現(xiàn)象組織起來,然后才來進(jìn)行理論上的解釋。例如說神經(jīng)網(wǎng)絡(luò)里的牛頓環(huán)、磁光克 爾效應(yīng)和法拉第現(xiàn)象會(huì)是怎樣的?

我和一小批同事已經(jīng)開始了?項(xiàng)重大的實(shí)踐工作,嘗試去分類構(gòu)建適合我們領(lǐng)域的解釋模型,去形式化它 們,并且用實(shí)驗(yàn)去驗(yàn)證它們。這項(xiàng)工作是巨大的,我認(rèn)為第?步應(yīng)該是構(gòu)建?個(gè)分層級(jí)的深度學(xué)習(xí)解釋模 型,以用于高中的教學(xué)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4834

    瀏覽量

    107616
  • 牛頓
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    6489
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5597

    瀏覽量

    124338

原文標(biāo)題:解釋深度學(xué)習(xí)的新角度,來自光學(xué)的啟發(fā)

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問世以來,多個(gè)在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機(jī)器學(xué)習(xí)(ML)的深度應(yīng)用,徹底重塑了整個(gè)行業(yè)的發(fā)展模
    的頭像 發(fā)表于 02-04 14:44 ?400次閱讀

    自然語言處理NLP的概念和工作原理

    自然語言處理 (NLP) 是人工智能 (AI) 的一個(gè)分支,它會(huì)教計(jì)算機(jī)如何理解口頭和書面形式的人類語言。自然語言處理將計(jì)算語言學(xué)與機(jī)器學(xué)習(xí)深度學(xué)
    的頭像 發(fā)表于 01-29 14:01 ?280次閱讀
    <b class='flag-5'>自然</b>語言處理NLP的概念和工作原理

    機(jī)器學(xué)習(xí)深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?171次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>和<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    穿孔機(jī)頂頭檢測儀 機(jī)器視覺深度學(xué)習(xí)

    LX01Z-DG626穿孔機(jī)頂頭檢測儀采用深度學(xué)習(xí)技術(shù),能夠?qū)崿F(xiàn)頂頭狀態(tài)的在線實(shí)時(shí)檢測,頂頭丟失報(bào)警,頂頭異常狀態(tài)報(bào)警等功能,響應(yīng)迅速,異常狀態(tài)視頻回溯,檢測頂頭溫度,配備吹掃清潔系統(tǒng),維護(hù)周期長
    發(fā)表于 12-22 14:33

    如何深度學(xué)習(xí)機(jī)器視覺的應(yīng)用場景

    深度學(xué)習(xí)視覺應(yīng)用場景大全 工業(yè)制造領(lǐng)域 復(fù)雜缺陷檢測:處理傳統(tǒng)算法難以描述的非標(biāo)準(zhǔn)化缺陷模式 非標(biāo)產(chǎn)品分類:對(duì)形狀、顏色、紋理多變的產(chǎn)品進(jìn)行智能分類 外觀質(zhì)量評(píng)估:基于學(xué)習(xí)的外觀質(zhì)量標(biāo)準(zhǔn)判定 精密
    的頭像 發(fā)表于 11-27 10:19 ?205次閱讀

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    圖 1:基于深度學(xué)習(xí)的目標(biāo)檢測可定位已訓(xùn)練的目標(biāo)類別,并通過矩形框(邊界框)對(duì)其進(jìn)行標(biāo)識(shí)。 在討論人工智能(AI)或深度學(xué)習(xí)時(shí),經(jīng)常會(huì)出現(xiàn)“神經(jīng)網(wǎng)絡(luò)”、“黑箱”、“標(biāo)注”等術(shù)語。這些概
    的頭像 發(fā)表于 09-10 17:38 ?882次閱讀
    如何在機(jī)器視覺中部署<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    深度學(xué)習(xí)對(duì)工業(yè)物聯(lián)網(wǎng)有哪些幫助

    深度學(xué)習(xí)作為人工智能的核心分支,通過模擬人腦神經(jīng)網(wǎng)絡(luò)的層級(jí)結(jié)構(gòu),能夠自動(dòng)從海量工業(yè)數(shù)據(jù)中提取復(fù)雜特征,為工業(yè)物聯(lián)網(wǎng)(IIoT)提供了從數(shù)據(jù)感知到智能決策的全鏈路升級(jí)能力。以下從技術(shù)賦能、場景突破
    的頭像 發(fā)表于 08-20 14:56 ?995次閱讀

    自動(dòng)駕駛中Transformer大模型會(huì)取代深度學(xué)習(xí)嗎?

    [首發(fā)于智駕最前沿微信公眾號(hào)]近年來,隨著ChatGPT、Claude、文心一言等大語言模型在生成文本、對(duì)話交互等領(lǐng)域的驚艷表現(xiàn),“Transformer架構(gòu)是否正在取代傳統(tǒng)深度學(xué)習(xí)”這一話題一直被
    的頭像 發(fā)表于 08-13 09:15 ?4145次閱讀
    自動(dòng)駕駛中Transformer大模型會(huì)取代<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>嗎?

    當(dāng)深度學(xué)習(xí)遇上嵌入式資源困境,特征空間如何破局?

    近年來,隨著人工智能(AI)技術(shù)的迅猛發(fā)展,深度學(xué)習(xí)(Deep Learning)成為最熱門的研究領(lǐng)域之一。在語音識(shí)別、圖像識(shí)別、自然語言處理等領(lǐng)域,深度
    發(fā)表于 07-14 14:50 ?1226次閱讀
    當(dāng)<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>遇上嵌入式資源困境,特征空間如何破局?

    嵌入式AI技術(shù)之深度學(xué)習(xí):數(shù)據(jù)樣本預(yù)處理過程中使用合適的特征變換對(duì)深度學(xué)習(xí)的意義

    ? 作者:蘇勇Andrew 使用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí),網(wǎng)絡(luò)的每個(gè)層都將對(duì)輸入的數(shù)據(jù)做一次抽象,多層神經(jīng)網(wǎng)絡(luò)構(gòu)成深度學(xué)習(xí)的框架,可以深度理解數(shù)據(jù)中所要表示的規(guī)律。從原理上看,使用
    的頭像 發(fā)表于 04-02 18:21 ?1493次閱讀

    用樹莓派搞深度學(xué)習(xí)?TensorFlow啟動(dòng)!

    介紹本頁面將指導(dǎo)您在搭載64位Bullseye操作系統(tǒng)的RaspberryPi4上安裝TensorFlow。TensorFlow是一個(gè)專為深度學(xué)習(xí)開發(fā)的大型軟件庫,它消耗大量資源。您可以在
    的頭像 發(fā)表于 03-25 09:33 ?1174次閱讀
    用樹莓派搞<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>?TensorFlow啟動(dòng)!

    在OpenVINO?工具套件的深度學(xué)習(xí)工作臺(tái)中無法導(dǎo)出INT8模型怎么解決?

    無法在 OpenVINO? 工具套件的深度學(xué)習(xí) (DL) 工作臺(tái)中導(dǎo)出 INT8 模型
    發(fā)表于 03-06 07:54

    如何排除深度學(xué)習(xí)工作臺(tái)上量化OpenVINO?的特定層?

    無法確定如何排除要在深度學(xué)習(xí)工作臺(tái)上量化OpenVINO?特定層
    發(fā)表于 03-06 07:31