chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌和亞馬遜怎么讓AI自己學習

汽車玩家 ? 來源:OFweek人工智能網(wǎng) ? 作者:將門創(chuàng)投 ? 2020-04-16 14:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能的學習總是需要大量數(shù)據(jù)的“喂養(yǎng)”??墒沁@數(shù)據(jù)要喂多少才是個頭呢?有沒有什么辦法能在少喂數(shù)據(jù)的同時,不影響AI的學習能力呢?或者直接把一些學習法則交給AI,讓它們舉一反三?谷歌和亞馬遜的研究人員近來就在琢磨這件事。

谷歌AI:背著有限的數(shù)據(jù)去探索新環(huán)境

來自卡耐基梅隆大學、谷歌和斯坦福大學的研究人員近日在一篇論文中寫道,他們開發(fā)出了一種“弱監(jiān)督”的人工智能訓練框架。該模型會給機器人大量有限的、不精確的、或者是有噪聲的數(shù)據(jù),讓它們通過數(shù)據(jù)學習,更好地探索一些極具挑戰(zhàn)性的環(huán)境。值得一提的是,研究人員“喂”給機器人的數(shù)據(jù)其實并不“完整”,機器人所得到的只是與它們所處的周圍環(huán)境直接相關的數(shù)據(jù)。然而出人意料的是,這套相對較少的數(shù)據(jù)反而提升了機器人操作任務的訓練效率。

這個名叫“弱監(jiān)督控制”(Weakly-Supervised Control,后文簡稱為WSC)的框架可以對語料庫進行學習;在學習過程中,智能代理(intelligent agents)可以生成自己的目標并執(zhí)行探索任務。

從形式上看,該框架整合了“強化學習機制”(一種通過獎勵來激勵完成目標的訓練形式)。但不同的是,傳統(tǒng)的強化學習需要研究人員手動設計獎勵,智能代理獲取獎勵的計算成本很高;與之相比,WSC構建的這種弱監(jiān)督學習機制是一種能隨著智能代理數(shù)據(jù)收集的進度而自行伸縮擴展的監(jiān)督方式。換句話說,該模型給代理們提出的獎勵目標是基于它們的學習能力和進度的。這樣不僅有利于智能代理的學習,對于研究人員來說,他們也不必在智能代理的強化學習循環(huán)中不斷增加新標簽了。

譯者注:在人工智能領域,智能代理/智能主體指的是一個能夠觀察周遭環(huán)境并為實現(xiàn)具體目標而付出一系列行動的自主實體。它通常是以軟件程序的形式出現(xiàn)的。

在實驗中,研究人員試圖確定弱監(jiān)督機制對學習一個解纏表現(xiàn)(disentangled state representation)是否足夠必要。他們給幾個模型布置了不同復雜度、基于視覺、以目標為條件的模擬操作任務。在一個環(huán)境中,智能代理的任務是將特定的對象移動到目標位置;而在另一個環(huán)境中,代理必須打開一扇門,并讓門開的角度符合任務要求。

論文作者表示,WSC比此前最先進的目標導向式強化學習機制的學習速度還要快。特別是當研究人員不斷提升智能代理所處環(huán)境復雜性的時候,這種學習速度上的優(yōu)勢表現(xiàn)的格外明顯。另外,研究人員還指出,對比智能代理的預設目標和其達成目標后的最終形態(tài),WSC的智能代理呈現(xiàn)出了更高的一致性。這表明,代理們通過該機制學到的是可釋性更強的目標達成策略。

不過研究人員也承認,WSC并非沒有局限性。它需要使用者給智能代理們標出各種與下游任務直接相關的各種要素,這就對使用者的專業(yè)知識提出了較高要求。此外,專家們還指出,他們目前的實驗都是在預訓練階段完成的,這個階段生成的內(nèi)容其實并不一定來自代理們與機制中的新要素所產(chǎn)生的互動結果?;诖?,他們下一步的工作就是要細致研究弱監(jiān)督機制的其他形式,看看它們能否給智能代理們提供新的有益信息。

“目前在實驗中的復雜環(huán)境里,WSC已經(jīng)呈現(xiàn)出了令人欣喜的成果。我們有理由相信,未來若能給真實環(huán)境下的機器人也應用這種機制,效果會更為喜人。”論文的合著者們寫道,“簡言之,我們相信,這個新框架提供了一個監(jiān)督通用目標學習機制在復雜環(huán)境下進行應用實踐的新視角?!?/p>

亞馬遜AI:用元學習機制來學會“舉一反三”

從上面的技術原理來看,谷歌的專家們有點像商人,他們的經(jīng)營思路是要在降低成本的同時,不影響產(chǎn)品(也就是AI的學習能力)的質(zhì)量和性能。與之相比,亞馬遜的研究人員更像是個老師,他們致力于“授人以漁”,讓AI學會舉一反三的能力。

在即將到來的ICLR上,亞馬遜的研究人員將提交一份關于元學習任務(meta-learning tasks)如何大幅提升AI學習能力的論文。

所謂元學習任務,即是一種能讓AI在完成相關目標的同時,還能引導其學會如何更好的進行學習的任務模式。亞馬遜的研究者聲稱,他們研發(fā)的這種任務模式資源消耗很?。褐恍枭贁?shù)幾個標簽訓練模板就能讓AI“舉一反三”,完成好一個個新任務。

在傳統(tǒng)的機器學習過程中,模型先是吸納一系列標記數(shù)據(jù)(支持集,support set),學習如何把標記數(shù)據(jù)與特征標簽(labels)關聯(lián)起來;而后,研究人員再喂給模型一些測試數(shù)據(jù)(測試集,query set),看看它能否根據(jù)此前學到的特征標簽來厘清這些新數(shù)據(jù)。

與此種方式相反,在元學習機制下,AI模型要同時運用自身訓練數(shù)據(jù)和研究人員給出的測試數(shù)據(jù)集來完成任務。在此過程中,模型還可以對兩套數(shù)據(jù)進行比對。這樣一來,AI在完成任務的同時,也能看得到自身對訓練數(shù)據(jù)的反應是如何影響其在測試數(shù)據(jù)上的表現(xiàn)的。

而在第二階段,也就是所謂的元測試階段(meta testing),模型要完成的測試任務與自己此前做的元學習任務有明顯的關聯(lián),卻又并不完全相同。和之前的方法相似,在執(zhí)行每個新任務的過程中,模型還是能同時看到訓練數(shù)據(jù)與測試數(shù)據(jù),但這一次,特征標簽都是未知的,AI必須通過此前的學習與自己得到的數(shù)據(jù)來進行判斷,正確找出數(shù)據(jù)與標簽的關聯(lián)性。

在元訓練過程中,研究人員所采用的技術并不需要學習一個完整的全局模型。他們的做法是訓練一個輔助模型,再通過它為每一個任務生成本地模型,并同時確定其所對應的支持集。

在完成上述工作后,他們又準備了一個輔助網(wǎng)絡,目的是充分利用測試集里的未標記數(shù)據(jù)。這樣到了元測試階段,研究人員就可以用測試集來對前文提到的本地模型進行微調(diào)了。

按照該團隊的說法,他們的系統(tǒng)通過一次任務學習就達到了16基線(baselines)。更具體的說,其所應用的新機制提高了AI從一個標記的示例出發(fā),去學習一個新對象分類任務的性能。根據(jù)底層AI模型體系結構的不同,這種提升幅度在11%和16%之間。

關于這項技術,Alexa Shopping 應用科學家巴勃羅·加西亞(Pablo Garcia)還在一篇博客中進行了介紹:

“過去10年,深度學習系統(tǒng)已經(jīng)在很多人工智能任務中取得了非同凡響的巨大成功。但在具體應用層面,其發(fā)揮空間一直比較有限。元學習機制有望讓機器學習系統(tǒng)訓練成‘多面手’……該機制的主體思路是讓系統(tǒng)能通過少量標簽訓練示例就能完成一個個新任務。很明顯,如果進展順利,元學習將大幅縮減勞動密集型數(shù)據(jù)注釋工作的需求。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6252

    瀏覽量

    111228
  • AI
    AI
    +關注

    關注

    91

    文章

    39531

    瀏覽量

    301067
  • 亞馬遜
    +關注

    關注

    8

    文章

    2729

    瀏覽量

    85703
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    谷歌自己發(fā)電,AI 系統(tǒng)會回到基礎工程嗎?

    2026年,谷歌開始自己發(fā)電。這不是能源布局,這是系統(tǒng)焦慮。當全球算力頂端的公司,把注意力轉向電力,意味著一個信號——AI的瓶頸,正在下沉。 不再只是芯片,不再只是參數(shù)。而是系統(tǒng)能否在現(xiàn)實世界里
    的頭像 發(fā)表于 02-12 15:59 ?2264次閱讀
    當<b class='flag-5'>谷歌</b><b class='flag-5'>自己</b>發(fā)電,<b class='flag-5'>AI</b> 系統(tǒng)會回到基礎工程嗎?

    強化學習自動駕駛模型學習更快嗎?

    是一種機器通過“試錯”學會決策的辦法。與監(jiān)督學習不同,監(jiān)督學習是有人提供示范答案,模型去模仿;而強化學習不會把每一步的“正確答案”都告訴
    的頭像 發(fā)表于 01-31 09:34 ?601次閱讀
    強化<b class='flag-5'>學習</b>會<b class='flag-5'>讓</b>自動駕駛模型<b class='flag-5'>學習</b>更快嗎?

    谷歌評論卡,碰一碰即可完成谷歌評論 #谷歌評論卡 #NFC標簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    亞馬遜云科技推出全新的Amazon AI Factories 將客戶現(xiàn)有基礎設施轉化為高性能AI環(huán)境

    亞馬遜云科技在2025 re:Invent全球大會上,宣布推出全新的Amazon AI Factories,助力企業(yè)將現(xiàn)有基礎設施轉化為高性能的AI環(huán)境。
    的頭像 發(fā)表于 12-13 13:44 ?708次閱讀

    融合AI的OpenHarmony應用軟件開發(fā):ai學習自律輔助軟件

    *附件:ai study.zip*附件:融合AI的OpenHarmony應用軟件開發(fā):ai學習自律輔助軟件.pdf 基于開源鴻蒙編寫的ai
    發(fā)表于 11-12 15:38

    AI眼鏡或成為下一代手機?谷歌、蘋果等巨頭扎堆布局

    近年來,AI智能眼鏡賽道迎來爆發(fā)式增長。谷歌、蘋果、Meta、亞馬遜等科技巨頭紛紛加快布局,將AI眼鏡視為下一代人機交互的關鍵入口。從消費級產(chǎn)品到行業(yè)專用設備,多樣化的
    的頭像 發(fā)表于 11-05 17:44 ?767次閱讀

    華曦達亮相谷歌AI亞洲峰會,AI Home業(yè)務高增長引領發(fā)展新征程

    AI亞洲峰會現(xiàn)場 華曦達基于谷歌云技術底座打造的AIHome解決方案及其自主研發(fā)的HomeAIAgent——Cedar成為關注焦點。該系統(tǒng)通過AI驅動的學習與自適應,實時理解并預測用戶
    的頭像 發(fā)表于 09-10 10:22 ?527次閱讀

    亞馬遜云科技AI聯(lián)賽:在全新終極AI對決中學習、創(chuàng)新和競爭

    自2018年以來,AWS DeepRacer 已吸引全球超過56萬名開發(fā)者參與,充分印證了開發(fā)者可以通過競技實現(xiàn)能力成長的實踐路徑。如今,亞馬遜云科技將通過亞馬遜云科技 AI 聯(lián)賽,將這一模式繼續(xù)拓展至生成式
    的頭像 發(fā)表于 08-05 18:03 ?737次閱讀

    今日看點丨亞馬遜上海AI研究院解散;索尼擬出售以色列芯片部門

    )正式解散。 ? 王敏捷指出,值得驕傲的是,我們從零孵化出全球知名的圖神經(jīng)網(wǎng)絡開源框架DGL,為亞馬遜電商創(chuàng)造了近10億美元的營收;僅實驗室規(guī)模的團隊,拿下機器學習與系統(tǒng)領域頂會全滿貫,發(fā)表100余篇頂會論文。轉向AI Agen
    發(fā)表于 07-24 09:42 ?1414次閱讀
    今日看點丨<b class='flag-5'>亞馬遜</b>上海<b class='flag-5'>AI</b>研究院解散;索尼擬出售以色列芯片部門

    亞馬遜云科技在2025紐約峰會發(fā)布多項AI agent創(chuàng)新

    重磅發(fā)布Amazon Bedrock AgentCore,亞馬遜云科技Marketplace上新并追加1億美金投資以加速agentic AI發(fā)展 Amazon Bedrock AgentCore通過
    的頭像 發(fā)表于 07-17 16:06 ?839次閱讀
    <b class='flag-5'>亞馬遜</b>云科技在2025紐約峰會發(fā)布多項<b class='flag-5'>AI</b> agent創(chuàng)新

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    視覺開發(fā)板開箱即用的離線AI能力,分類列出學習課程知識點和實操參考,希望能夠幫助大家快速掌握離線 AI 智能硬件的基礎知識與實戰(zhàn)技能,同時了解相關AI技術在實際場景的應用情況。正文按入
    發(fā)表于 07-04 11:14

    Agentic AI再豎里程碑,這次引爆革命的還是亞馬遜云科技

    科技云報到原創(chuàng)。 誰都知道AI發(fā)展的速度日新月異,但當里程碑即將出現(xiàn)時,所有人依然心潮澎湃。 在亞馬遜云科技中國峰會上,Agentic AI就是這顆耀眼的科技新星。亞馬遜全球副總裁、
    的頭像 發(fā)表于 06-25 10:28 ?565次閱讀
    Agentic <b class='flag-5'>AI</b>再豎里程碑,這次引爆革命的還是<b class='flag-5'>亞馬遜</b>云科技

    【「零基礎開發(fā)AI Agent」閱讀體驗】+ 入門篇學習

    很高興又有機會學習ai技術,這次試讀的是「零基礎開發(fā)AI Agent」,作者葉濤、管鍇、張心雨。 大模型的普及是近三年來的一件大事,萬物皆可大模型已成為趨勢。作為大模型開發(fā)應用中重要組成部分,提示詞
    發(fā)表于 05-02 09:26

    首創(chuàng)開源架構,天璣AI開發(fā)套件端側AI模型接入得心應手

    科正將AI能力體系化并賦能終端生態(tài)。 大會上,聯(lián)發(fā)科定義了“智能體化用戶體驗”的五大特征:主動及時、知你懂你、互動協(xié)作、學習進化和專屬隱私信息守護。這五大特征需要跨越從芯片、模型、應用、終端乃至整個
    發(fā)表于 04-13 19:52

    AI Agent 應用與項目實戰(zhàn)》----- 學習如何開發(fā)視頻應用

    再次感謝發(fā)燒友提供的閱讀體驗活動。本期跟隨《AI Agent 應用與項目實戰(zhàn)》這本書學習如何構建開發(fā)一個視頻應用。AI Agent是一種智能應用,能夠根據(jù)用戶需求和環(huán)境變化做出相應響應。通?;谏疃?/div>
    發(fā)表于 03-05 19:52