chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

<bdo id="0j2zo"><rt id="0j2zo"></rt></bdo>

<track id="0j2zo"></track>

<rp id="0j2zo"></rp>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認(rèn)識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

一個大規(guī)模多任務(wù)學(xué)習(xí)框架μ2Net

【導(dǎo)讀】谷歌大神Jeff Dean最近親自操刀發(fā)新作，提出了一個大規(guī)模多任務(wù)學(xué)習(xí)框架μ2Net，基本把各大數(shù)據(jù)集多任務(wù)學(xué)習(xí)的SOTA刷了個遍，但這次為何網(wǎng)友有點不買賬了？很簡單，差錢。

2021年10月，Jeff Dean親自撰文介紹了一個全新的機器學(xué)習(xí)架構(gòu)——Pathways。目的很簡單，就是讓一個AI能夠跨越數(shù)以萬計的的任務(wù)，理解不同類型的數(shù)據(jù)，并同時以極高的效率實現(xiàn)：

在大半年之后的2022年3月，Jeff Dean終于發(fā)布了Pathways的論文。

論文連接：https://arxiv.org/abs/2203.12533 其中，補充了不少技術(shù)上的細(xì)節(jié)，比如最基本的系統(tǒng)架構(gòu)等等。

2022年4月，谷歌用Pathways的PaLM語言模型橫空出世，接連打破多項自然語言處理任務(wù)的SOTA，這個擁有5400億參數(shù)的Transformer語言模型再次證明了「大力出奇跡」。除了用到強大的Pathways系統(tǒng)外，論文中介紹PaLM的訓(xùn)練用到了6144個TPU v4，使用了7800億token的高質(zhì)量數(shù)據(jù)集，并且其中有一定比例的非英文多語種語料。

論文地址：https://arxiv.org/abs/2204.02311 最近，Jeff Dean一篇新作又引發(fā)了大家對Pathways的猜測。

Pathways的拼圖又合上了一塊？

這篇論文的作者只有兩位：大名鼎鼎的Jeff Dean和來自意大利的工程師Andrea Gesmundo。有趣的是，不僅Gesmundo很低調(diào)，而且前兩天剛吹完自家Imagen的Jeff Dean也完全沒有在推特上提及此事。而有網(wǎng)友拜讀之后推測，這可能是下一代AI架構(gòu)Pathways的組成部分。

論文地址：https://arxiv.org/abs/2205.12755 本文的思路是這樣的：通過動態(tài)地將新任務(wù)納入一個大型運行系統(tǒng)，可以利用稀疏多任務(wù)機器學(xué)習(xí)模型的碎片，來實現(xiàn)新任務(wù)質(zhì)量的提升，并可以在相關(guān)任務(wù)之間自動分享模型的碎片。這種方法可以提高每個任務(wù)的質(zhì)量，并在收斂時間、訓(xùn)練實例數(shù)量、能源消耗等方面提高模型效率。本文提出的機器學(xué)習(xí)問題框架，可以視作標(biāo)準(zhǔn)多任務(wù)和持續(xù)學(xué)習(xí)形式化的概括和綜合。在這個框架下，再大的任務(wù)集都可以被聯(lián)合解決。而且，隨著時間的推移，任務(wù)集中可以加入連續(xù)的新任務(wù)流來實現(xiàn)擴展。預(yù)訓(xùn)練任務(wù)和下游任務(wù)之間的區(qū)別也不存在了。因為，隨著新任務(wù)的加入，系統(tǒng)會尋找如何將已有的知識和表征與新的模型能力相結(jié)合，以實現(xiàn)每個新任務(wù)的高質(zhì)量水平。在解決一個新任務(wù)時獲得的知識和學(xué)到的表征，也可用于任何未來的任務(wù)，或繼續(xù)學(xué)習(xí)現(xiàn)有任務(wù)。這個方法名為「突變多任務(wù)網(wǎng)絡(luò)」或μ2Net。（μ=Mutation）

用于大規(guī)模持續(xù)學(xué)習(xí)實驗的兩類突變模型簡單說，就是生成一個大規(guī)模的多任務(wù)網(wǎng)絡(luò)，去聯(lián)合解決多個任務(wù)。不僅每個任務(wù)的質(zhì)量和效率都獲得了提升，還可以通過動態(tài)增加新的任務(wù)來實現(xiàn)模型的擴展。通過對以前任務(wù)的學(xué)習(xí)，嵌入到系統(tǒng)中的知識積累越多，后續(xù)任務(wù)的解決方案的質(zhì)量就越高。此外，在減少每個任務(wù)新添加的參數(shù)方面，新任務(wù)的解決效率可以不斷提高。生成的多任務(wù)模型是稀疏激活的，模型集成了基于任務(wù)的路由機制，隨著模型的擴展，保證每個任務(wù)的計算成本的上升是有界限的。

每個任務(wù)激活的和增加的參數(shù)占多任務(wù)系統(tǒng)參數(shù)總數(shù)的百分比從每個任務(wù)學(xué)到的知識被分割成可以被多個任務(wù)重用的部分。實驗證明，這種分塊技術(shù)避免了多任務(wù)和持續(xù)學(xué)習(xí)模型的常見問題，如災(zāi)難性遺忘、梯度干擾和負(fù)遷移。對任務(wù)路線空間的探索和對每個任務(wù)最相關(guān)的先驗知識子集的識別是由一個進化算法引導(dǎo)的，該算法旨在動態(tài)地調(diào)整探索/利用的平衡，而不需要手動調(diào)整元參數(shù)。同樣的進化邏輯被用于動態(tài)調(diào)整超參數(shù)多任務(wù)模型組件。

既然叫「突變網(wǎng)絡(luò)」，這個突變是怎么解釋的？深度神經(jīng)網(wǎng)絡(luò)通常由架構(gòu)和超參數(shù)來定義。本文中的架構(gòu)是由一連串的神經(jīng)網(wǎng)絡(luò)層組成的。每個層將輸入向量映射到一個可變維度的輸出向量，網(wǎng)絡(luò)實例化的細(xì)節(jié)，比如優(yōu)化器或數(shù)據(jù)預(yù)處理的配置，則由超參數(shù)確定。所以這里講的突變也分為兩類，層克隆突變和超參數(shù)突變。層克隆突變創(chuàng)建了一個可以被子模型訓(xùn)練的任何父模型圖層的副本。如果父模型的某層沒有被選中進行克隆，會凍結(jié)當(dāng)前狀態(tài)并與子模型共享，以保證預(yù)先存在的模型的不變性。超參數(shù)突變則用于修改子層從父層繼承的配置。每個超參數(shù)的新值可以從一組有效值中抽取。對于數(shù)字超參數(shù)，有效值集被排序為一個列表，采樣時僅限于相鄰值，以應(yīng)用一個增量變化約束。來看看實際效果如何：

在ImageNet 2012、cifar100、cifar10三個數(shù)據(jù)集上，μ2Net在5任務(wù)迭代、10任務(wù)迭代后的表現(xiàn)均超過了當(dāng)前最通用和性能最好的ViT預(yù)訓(xùn)練微調(diào)模型。在任務(wù)擴展方面，在加入VTAB-full和VDD持續(xù)學(xué)習(xí)任務(wù)后，μ2Net性能表現(xiàn)獲得進一步提升，在cifar10數(shù)據(jù)集上的VDD持續(xù)學(xué)習(xí)任務(wù)表現(xiàn)達(dá)到了99.43%的最佳成績。

在多任務(wù)字符分類基準(zhǔn)任務(wù)上，在兩次任務(wù)迭代后，μ2Net在大部分?jǐn)?shù)據(jù)集上刷新了SOTA水平，數(shù)據(jù)集規(guī)模由2.5k到240k樣本容量不等。

簡單來說，在這個架構(gòu)之下，模型學(xué)習(xí)的任務(wù)越多，系統(tǒng)學(xué)到的知識就越多，也就越容易解決新的任務(wù)。比如，一個ViT-L架構(gòu)（3.07億個參數(shù)）可以演變成一個具有1308.7億個參數(shù)的多任務(wù)系統(tǒng)，并解決69個任務(wù)。此外，隨著系統(tǒng)的增長，參數(shù)激活的稀疏性使每個任務(wù)的計算量和內(nèi)存用量保持不變。實驗表面，每個任務(wù)平均增加的參數(shù)減少了38%，而多任務(wù)系統(tǒng)只激活了每個任務(wù)總參數(shù)的2.3%。當(dāng)然，在這一點上，它只是一個架構(gòu)和初步實驗。

網(wǎng)友：論文很好，但……

雖然論文很棒棒，但好像有人不買賬。有些熱愛戳穿皇帝新衣的網(wǎng)友，在reddit上發(fā)帖，稱他再也不相信愛情……哦不，「頂級實驗室/研究機構(gòu)」出品的AI論文了。這位ID為「Acurite先生」的網(wǎng)友稱，他自然相信這些論文里的數(shù)據(jù)與模型運行結(jié)果。但，就拿Jeff Dean老師的這篇論文來說吧，18頁的論文說了特別復(fù)雜的進化卷積與多任務(wù)學(xué)習(xí)算法，厲害，亮眼，好頂贊。不過，有兩點不得不提出：第一，Jeff Dean們在論文中提出的證明自己勝過競品的跑分結(jié)果，是CIFAR-10基準(zhǔn)測試準(zhǔn)確度99.43，勝過了當(dāng)前SOTA的99.40…… 也不能說這是忽悠，但真的很讓人難以措辭形容。

第二，論文末尾有用TPU跑算法得出最終結(jié)果的時間耗費表，總計17810小時。假設(shè)有人不在谷歌干、又想復(fù)現(xiàn)論文結(jié)果，按照每小時3.22美元的市價租TPU來再跑一次，那花費就是57348美元。有啥意思呢？連日常論文都要設(shè)置鈔能力門檻了嗎？當(dāng)然，這種做派現(xiàn)在是業(yè)界風(fēng)氣，包括但不限于谷歌、OpenAI這些大玩家。大家都往模型里灌少少改進現(xiàn)狀的創(chuàng)意、和多多的預(yù)處理數(shù)據(jù)與基準(zhǔn)。然后，只要運行結(jié)果在數(shù)值上比對家高出哪怕百分點后的小數(shù)點后二位，研究者也可以理直氣壯地在簡歷上新增一行論文題目啦！這么搞，對學(xué)界和業(yè)界有啥真的推動？普通研究生又花不起錢來驗證你的結(jié)論，普通企業(yè)又沒法在項目里使用這么無聊的跑分。還是那句話，有啥意思呢？這難道就是AI界的可接受舒適區(qū)么？一小撥大企業(yè)、和偶爾的頂尖學(xué)校，天天炫耀我有錢可以為所欲為、你沒錢只好跟后面吃灰？這么玩下去，干脆另開個計算機學(xué)期刊，專收那些結(jié)果可以在消費級單機顯卡上八小時跑出復(fù)現(xiàn)的論文算了。跟帖里，有論文任務(wù)的研究生們紛紛訴苦。有位ID是「支持向量機」的網(wǎng)友說，自己是小型實驗室里的從業(yè)者，因為這個勢頭，已經(jīng)快完全喪失繼續(xù)搞深度學(xué)習(xí)的動力了。因為靠自己實驗室的預(yù)算，根本沒法和這些巨無霸比，出不了鈔能力打底的跑分結(jié)果。即使你有個理論上的新點子，要寫成能過評議的論文也難。因為現(xiàn)在論文評議人里，被大廠的鈔能力養(yǎng)出了「美圖偏見」，論文里用來測試的圖像不好看，一切白搭。不是說巨無霸大廠一無是處啊，GPT和DALL-E這些項目真的是開天辟地。但如果我自己的機器跑不動，我激動個啥呢。另有一個博士生網(wǎng)友現(xiàn)身說法，跟帖佐證「支持向量機」。博士生前兩年遞交了一份關(guān)于流模型的論文，主要著重于發(fā)現(xiàn)可采樣的數(shù)據(jù)潛在空間，對模型的圖片生成質(zhì)量沒影響。結(jié)果論文打分人給的批評意見是：「生成的圖像看起來不如用GAN生成的好」。另一個ID叫「烏代」的研究生也說，2021年他提交的參加會議論文，打分人給的批評意見是：「數(shù)據(jù)不夠花哨。」

看來人力不敵鈔能力，真是東西心理攸同、中外道術(shù)未裂的世界性趨勢。不過三十年河?xùn)|、三十年河西，說不定算法草根化、全民大寫碼，會帶來第二次車庫創(chuàng)業(yè)企業(yè)打敗IBM的奇跡呢。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

框架

框架

+關(guān)注

關(guān)注
0

文章
404

瀏覽量
18340
機器學(xué)習(xí)

機器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8542

瀏覽量
136333
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1232

瀏覽量
26073

原文標(biāo)題：Jeff Dean大規(guī)模多任務(wù)學(xué)習(xí)SOTA遭吐槽，復(fù)現(xiàn)一遍要6萬美元！

文章出處：【微信號：CVSCHOOL，微信公眾號：OpenCV學(xué)堂】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評論

OpenCV學(xué)堂
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot 灰度共生矩陣(GLCM)基本原理
Hot UNet和UNet++：醫(yī)學(xué)影像經(jīng)典分割網(wǎng)絡(luò)對比

New 常見人體姿態(tài)評估顯示方式的兩種方式
New 手寫圖像模板匹配算法在OpenCV中的實現(xiàn)

精選推薦
更多

文章

資料

帖子

Buildroot?MQTT-Modbus?網(wǎng)關(guān)開發(fā)，實現(xiàn)設(shè)備遠(yuǎn)程監(jiān)控方案-米爾RK3506

米爾電子
3小時前

94 閱讀

第7章變量進階與點陣LED（7.5 7.6）

137933yu
18小時前

1227 閱讀

保障數(shù)據(jù)中心安全：磁傳感器如何筑起「隱形防線」？

斯丹麥德電子
18小時前

1195 閱讀

CBM809x系列國產(chǎn)運放，能耗雙優(yōu)?兼容無顧慮

芯佰微電子
20小時前

1110 閱讀

瑞芯微(EASY EAI)RV1126B AHD攝像頭

廣州靈眸科技有限公司
21小時前

1174 閱讀

用于COB的PCB設(shè)計指導(dǎo)書

h1654155805.2348
525 KB

免費

0下載

MATLAB程序設(shè)計講義

760608972
1.33 MB

免費

0下載

FlashDB IoT超輕量級嵌入式數(shù)據(jù)庫

余溫重顧
7.13 MB

2積分

2下載

PuddingAlert Android Toast/SnackBar替代方案

陳游斗
8.32 MB

2積分

1下載

ZNbase NewSQL分布式數(shù)據(jù)庫

陳勇
4.69 MB

免費

0下載

固件版本錯配：一個讓老工程師都栽過跟頭的“低級錯誤”

jf_18828426
11小時前

26 閱讀

PCB設(shè)計知識又增加了：聽都沒聽過的電容，濾波性能竟然這么好？

edadoc
11小時前

94 閱讀

【瑞薩RA6E2地奇星開發(fā)板試用】串口通信中文亂碼怎么解決

jf_81270192
1天前

96 閱讀

【瑞薩RA6E2地奇星開發(fā)板試用】串口通信報錯：標(biāo)準(zhǔn)輸出流 stdout 未定義

jf_81270192
1天前

100 閱讀

關(guān)于CS1180S一片當(dāng)兩片用遇到的問題

風(fēng)一22
1天前

281 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

華秋（原“華強聚豐”）：

電子發(fā)燒友

華秋開發(fā)

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網(wǎng)站地圖

設(shè)計技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設(shè)計

存儲技術(shù)

光電顯示

EMC/EMI設(shè)計

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實

可穿戴設(shè)備

機器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計資源

設(shè)計技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務(wù)

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗

設(shè)計大賽

華秋

關(guān)于我們

投資關(guān)系

新聞動態(tài)

加入我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡(luò)

微博

移動端

發(fā)燒友APP

硬聲APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

黃晶晶：huangjingjing@elecfans.com

內(nèi)容合作（海外）

張迎輝：mikezhang@elecfans.com

供應(yīng)鏈服務(wù) PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區(qū)合作

劉勇：liuyong@huaqiu.com

關(guān)注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

電子工程師社區(qū)

1-32層PCB打樣·中小批量

元器件現(xiàn)貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業(yè)動態(tài)

聯(lián)系我們

企業(yè)文化

企業(yè)宣傳片

加入我們

版權(quán)所有 ? 湖南華秋數(shù)字科技有限公司

長沙市望城經(jīng)濟技術(shù)開發(fā)區(qū)航空路6號手機智能終端產(chǎn)業(yè)園2號廠房3層（0731-88081133）
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023018690號-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费