chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

對話機器人之LaMDA

深度學(xué)習(xí)自然語言處理 ? 來源:NLP日志 ? 2023-01-04 14:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來自:NLP日志

提綱1 簡介 2 LaMDA 3 總結(jié)

1 簡介

LaMDA是在DeepMind的Sparrow跟openai的instructGPT之前由谷歌提出的對話機器人,全稱Language Models for Dialog Applications,是一個在海量對話跟web數(shù)據(jù)上進行預(yù)訓(xùn)練再在人工標(biāo)注數(shù)據(jù)上做進一步微調(diào)后得到的參數(shù)量高達(dá)137B的大模型。LaMDA除了在生成文本質(zhì)量有所提升外,通過在人工標(biāo)注數(shù)據(jù)上做進一步finetune以及讓模型學(xué)會檢索利用外部知識源的能力,使得模型在安全性以及事實性這兩個關(guān)鍵問題上獲得明顯提升。

安全性指的是模型的回復(fù)應(yīng)該滿足一系列人為價值觀,例如沒有歧視跟偏見,不會生成傷害性建議。事實性指的模型的回復(fù)應(yīng)該符合事實,跟外部知識源保持一致,而不是一本正經(jīng)的胡說八道。???????

83dd799a-884f-11ed-bfe3-dac502259ad0.png

圖1: LaMDA在生成文本在多個指標(biāo)下有明顯提升

2 LaMDA

Pre-training

LaMDA采用的是純decoder的結(jié)構(gòu),類似于GPT,使用了46層Transformer,模型參數(shù)量高達(dá)130B,是Meena的50倍。預(yù)訓(xùn)練的任務(wù)是預(yù)測文本中的下一個token,解碼策略跟Meenay一致,都是從top-40結(jié)果采樣得到16個候選回復(fù),再基于候選回復(fù)的對數(shù)似然得分跟長度選擇最優(yōu)的回復(fù)。不同于此前的對話模型只在對話數(shù)據(jù)上訓(xùn)練,LaMDA的預(yù)訓(xùn)練數(shù)據(jù)集包括對話數(shù)據(jù)(1.12B)和其他web文檔數(shù)據(jù)(2.97B)。

83ffe962-884f-11ed-bfe3-dac502259ad0.png

圖2: LaMDA預(yù)訓(xùn)練任務(wù)????

Finetune

LaMDA的finetune包括兩部分,一部分是針對生成文本質(zhì)量跟安全性,另一部分則是學(xué)習(xí)如何利用外部的信息檢索系統(tǒng)。其中質(zhì)量(SS I)可以從三方面評估,分別是sensibleness(文本是否合理,跟歷史對話是否有沖突),Specificity(對于前文是否有針對性,避免籠統(tǒng)回復(fù),例如用戶提問“I love Eurovision”,模型生成一個籠統(tǒng)回復(fù)“Me too”就不符合預(yù)期),Interestingness(文本是否能引起某人注意或者好奇,是否是超出期待的巧妙回復(fù))。而安全性(Safety)的目標(biāo)則是要符合谷歌AI的基本原則,避免生成會造成傷害的不符合預(yù)期的結(jié)果,或者帶有偏見跟歧視。

a)Finetuning for quality and safety

這部分的finetune既包括給定上文生成回復(fù)的生成任務(wù),也包括評估回復(fù)質(zhì)量跟安全性的判別式任務(wù)。對于生成任務(wù),訓(xùn)練樣本格式由“”(上文,哨兵,回復(fù))三部分拼接而成,損失只計算其中response相關(guān)那部分,也就是在給定歷史上文條件下,只計算模型生成回復(fù)跟期望回復(fù)之間的損失。而對于判別任務(wù),訓(xùn)練樣本則是“” (上文,哨兵,回復(fù),屬性,得分)五部分拼接得到,損失只計算屬性對應(yīng)的rating得分損失,也就是在給定歷史上文跟模型回復(fù)條件下,計算特定屬性下的模型得分跟人工標(biāo)注結(jié)果之間的損失。這種LaMDA同時用于生成跟判別的設(shè)計能夠?qū)崿F(xiàn)一個更佳高效的流程,在生成回復(fù)后,使用判別模型打分時需要對應(yīng)指標(biāo)的概率P(|),而生成模型已經(jīng)處理過了,所以只需要在額外處理少量的跟attribute-name相關(guān)的token即可。

Finetune過程先對LaMDA的判別任務(wù)進行優(yōu)化,使得模型可以預(yù)測候選回復(fù)的質(zhì)量得分跟安全性得分,然后過濾掉安全性得分低于閾值的候選回復(fù),再根據(jù)質(zhì)量得分對候選回復(fù)進行排序(3*P(sensibleness)+P(specificity)+P(interestingness)),選擇其中得分最高的回復(fù)作為模型生成的結(jié)果。再利用已經(jīng)訓(xùn)練后LaMDA的打分模型,篩選出高質(zhì)量的訓(xùn)練數(shù)據(jù),用于LaMDA的生成任務(wù)的finetune,使得模型可以生成高質(zhì)量的回復(fù)。根據(jù)下圖也可以看到利用高質(zhì)量數(shù)據(jù)進行的finetune讓模型在各方面都有了明顯的提升。

841e2864-884f-11ed-bfe3-dac502259ad0.png

圖3: finetune模型在多個指標(biāo)上的提升

b)Finetuning to learn to call an external information retrieval system

這部分也稱為Groundedness,針對語言模型的可能生成看起來可信,但是違背事實的幻視問題,LaMDA通過學(xué)習(xí)使用利用外部知識源去緩解這個問題。LaMDA構(gòu)建一個包含信息檢索系統(tǒng),計算模塊,翻譯模塊的工具(簡稱TS),這部分的finetune也包括兩個子任務(wù),第一個是將歷史上文跟模型回復(fù)一起輸入到模型中,生成對應(yīng)的檢索query。第二個子任務(wù)是將歷史上文+模型回復(fù)+檢索結(jié)果一同輸入到模型中,讓模型決定是生成新的檢索query或者生成最終回復(fù)(根據(jù)生成的第一個字符串決定,如果是TS,則繼續(xù)檢索,如果是User則返回對應(yīng)結(jié)果)

8461f1d4-884f-11ed-bfe3-dac502259ad0.png

圖4: LaMDA Search流程?

在具體推理流程中,只用一個LaMDA模型,但是做了多個子任務(wù),具體過程中該執(zhí)行哪個子任務(wù),則由當(dāng)前輸入的prompt決定,例如當(dāng)前輸入prompt是LaMDA to user就對應(yīng)自動生成回復(fù),如果當(dāng)前prompt是LaMDA-Base to LaMDA-Research就對應(yīng)生成檢索query。

3 總結(jié)

從LaMDA跟后續(xù)的Sparrow,我們也可以看到一些共同點。1)可以使用一個強大的模型同時處理多個不同任務(wù)。????2)finetune階段高質(zhì)量數(shù)據(jù)對于模型的最終性能影響頗大,為了得到這些高質(zhì)量的數(shù)據(jù),LaMDA跟Sparrow在搜集finetune數(shù)據(jù)有一套嚴(yán)格的方法論。3) 讓模型學(xué)習(xí)檢索利用外部知識源,可以緩解模型幻視的問題,讓模型生成結(jié)果更佳有理可依,也讓模型可以回答與時俱進的問題。?????????????4)為生成文本的安全性設(shè)計額外的子任務(wù),從而緩解敏感性的問題。LaMDA的成功,依舊貫徹著大力出奇跡的思路,不僅模型的參數(shù)量龐大,預(yù)訓(xùn)練的語料龐大,連finetune階段的人工標(biāo)注數(shù)據(jù)也不是一般人可以承受的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    31019

    瀏覽量

    221932
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3735

    瀏覽量

    52066

原文標(biāo)題:對話機器人之LaMDA

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    智能AI機器人定制開發(fā)_AI陪伴對話機器人主板方案

    隨著人工智能技術(shù)的飛速發(fā)展,AI機器人逐漸滲透到家庭陪伴、教育科普、商業(yè)接待等多個領(lǐng)域。為了滿足多樣化的應(yīng)用需求,AI機器人硬件架構(gòu)需具備“高性能、低功耗、多形態(tài)、易落地”的特點。AI機器人采用聯(lián)發(fā)
    的頭像 發(fā)表于 01-28 19:47 ?150次閱讀
    智能AI<b class='flag-5'>機器人</b>定制開發(fā)_AI陪伴<b class='flag-5'>對話機器人</b>主板方案

    AI機器人方案_ai人機對話機器人PCBA硬件定制開發(fā)

    隨著人工智能技術(shù)的不斷進步,人機交互的方式正變得更加自然與高效。一款基于聯(lián)發(fā)科MTK八核處理器的AI對話機器人方案脫穎而出,憑借其強大的性能、多樣化顯示方案和卓越的語音交互能力,成為家庭、教育、智能服務(wù)等場景中不可或缺的智能助手。
    的頭像 發(fā)表于 12-24 20:19 ?936次閱讀
    AI<b class='flag-5'>機器人</b>方案_ai人機<b class='flag-5'>對話機器人</b>PCBA硬件定制開發(fā)

    RK3576機器人核心:三屏異顯+八路攝像頭,重塑機器人交互與感知

    時人臉識別、物體檢測與跟蹤等。同時,在高負(fù)載下,芯片溫度穩(wěn)定在65℃左右,證明了其優(yōu)異的高能效比和低發(fā)熱特性,非常適合對功耗和散熱敏感的機器人產(chǎn)品。 為什么RK3576是機器人開發(fā)的理想
    發(fā)表于 10-29 16:41

    小蘿卜機器人的故事

    經(jīng)過我的申請, 馬老師發(fā)放了, 小蘿卜機器人的, 開發(fā)權(quán)限, 原來的小蘿卜公司, 因為經(jīng)營不善倒閉, 作為科研產(chǎn)品, 幾個技術(shù)對此惋惜, 自掏腰包, 要讓小蘿卜機器人, 再生, 每次聽到小蘿卜說
    發(fā)表于 10-23 05:24

    機器人競技幕后:磁傳感器芯片激活 “精準(zhǔn)感知力”

    2025 世界人形機器人運動會于 8 月 17 日圓滿收官,賽場上機器人在跑步、跳躍、抓取等項目中的精彩表現(xiàn),背后是運動控制、環(huán)境感知等技術(shù)的迭代升級。而在這些技術(shù)中,磁傳感器芯片憑借獨特優(yōu)勢,成為
    發(fā)表于 08-26 10:02

    工業(yè)機器人的特點

    0.3%的年化生產(chǎn)力提升。因此,發(fā)展工業(yè)機器人推動國內(nèi)自動化水平,提高產(chǎn)出是目前的不二選。 ** 適用范圍廣** 機器人相對于工人的優(yōu)勢還體現(xiàn)在應(yīng)用范圍廣。機器人可以運用在危險、惡劣
    發(fā)表于 07-26 11:22

    對話:人形機器人連接器與線纜有何攻關(guān)點?

    與線纜技術(shù)突破成為破局關(guān)鍵。然而,機器人高頻傳輸與空間壓縮的技術(shù)矛盾、百萬次彎折壽命的可靠性挑戰(zhàn),以及行業(yè)標(biāo)準(zhǔn)缺失引發(fā)的產(chǎn)業(yè)鏈協(xié)同困境,正成為制約機器人產(chǎn)業(yè)發(fā)展的核心瓶頸。 《國際線纜與連接》通過深度對話TE Connectiv
    的頭像 發(fā)表于 07-11 15:13 ?957次閱讀
    <b class='flag-5'>對話</b>:人形<b class='flag-5'>機器人</b>連接器與線纜有何攻關(guān)點?

    當(dāng)機器人遇上“語言障礙”:CCLINKIE轉(zhuǎn)Profinet的“破冰外掛”來啦\\!

    ”才到機器人控制器,焊接精度從±0.1mm“漂移”到±0.3mm。直到一次技術(shù)改造,讓不同協(xié)議的設(shè)備實現(xiàn)了“無障礙對話”,這場工業(yè)互聯(lián)的破局戰(zhàn),藏著哪些硬核邏輯? 一、協(xié)議壁壘下的生產(chǎn)痛點 某合資車企
    發(fā)表于 06-04 14:31

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機器人領(lǐng)域的變革力量

    連續(xù)的長句語音識別,還是復(fù)雜口音的處理,都能快速響應(yīng),保證語音機器人與用戶之間流暢的對話體驗。 其豐富的接口為語音機器人的功能拓展提供了可能。USB接口可以連接高靈敏度的麥克風(fēng)陣列,實現(xiàn)精準(zhǔn)的語音采集
    發(fā)表于 05-28 11:36

    盤點#機器人開發(fā)平臺

    地瓜機器人RDK X5開發(fā)套件地瓜機器人RDK X5開發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機器人開發(fā)套件 Kria KR260機器人開發(fā)套件 Kria KR260-
    發(fā)表于 05-13 15:02

    詳細(xì)介紹機場智能指路機器人的工作原理

    機場智能指路機器人主要依靠感知系統(tǒng)、定位系統(tǒng)、導(dǎo)航系統(tǒng)、智能交互系統(tǒng)和運動系統(tǒng)協(xié)同工作,來實現(xiàn)為旅客準(zhǔn)確指路和提供服務(wù)的功能,以下是其詳細(xì)工作原理: 感知系統(tǒng) 傳感器類型 :機器人配備了多種傳感器
    發(fā)表于 05-10 18:26

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】機器人入門的引路書

    ROS的全稱:Robot Operating System 機器人操作系統(tǒng) ROS的 目的 :ROS支持通用庫,是通信總線,協(xié)調(diào)多個傳感器 為了解決機器人里各廠商模塊不通用的問題,讓機器人快速開發(fā)
    發(fā)表于 04-30 01:05

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】+內(nèi)容初識

    《ROS 2智能機器人開發(fā)實踐》內(nèi)容閱讀初體驗 《ROS 2 智能機器人開發(fā)實踐》是一本針對 ROS 2(Robot Operating System 2)這一先進機器人開發(fā)框架的實用指南。隨著
    發(fā)表于 04-27 11:24

    什么是機器人?追蹤機器人技術(shù)的發(fā)展和未來

    什么是機器人? 我們都知道“機器人”這個詞,并在日常對話中隨意使用它。但我們知道它真正的含義嗎?讓我們花點時間來深入研究機器人的定義。它是像看起來那么簡單,還是挑戰(zhàn)了我們的理解? 在其
    的頭像 發(fā)表于 04-24 19:21 ?4703次閱讀

    名單公布!【書籍評測活動NO.58】ROS 2智能機器人開發(fā)實踐

    資格! 從 PC 到智能手機,下一個更大的計算平臺是什么? 最佳答案可能是 機器人 ! 如果設(shè)想成真,則需要有人為機器人“造腦”,即打造適配的計算平臺及操作系統(tǒng)。 就像以計算機為平臺的計算機時代,和以
    發(fā)表于 03-03 14:18