chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>ChatGPT能否成為下一代搜索引擎

ChatGPT能否成為下一代搜索引擎

2023-02-10 | pdf | 1.44 MB | 次下載 | 免費(fèi)

資料介紹

前 言 OpenAI這家公司又放大招了,繼發(fā)布GPT、GPT2和GPT3模型后,本月初發(fā)布了ChatGPT模型【也被稱為GPT3.5】,結(jié)合大家的測(cè)試效果來看,該模型效果確實(shí)很震撼,在人工智能圈子引起了不小的轟動(dòng)。在AI發(fā)展相對(duì)處于低谷期的今天,如此震撼的模型發(fā)布出來,確實(shí)為該行業(yè)帶來一陣暖風(fēng),本文就詳細(xì)解讀一下該模型。

  在“人工標(biāo)注數(shù)據(jù)+強(qiáng)化學(xué)習(xí)”框架下,具體而言,InstructGPT的訓(xùn)練過程分為以下三個(gè)階段:

  第一階段:冷啟動(dòng)階段的監(jiān)督策略模型

  靠GPT 3本身,盡管它很強(qiáng),但是它很難理解人類不同類型指令中蘊(yùn)含的不同意圖,也很難判斷生成內(nèi)容是否是高質(zhì)量的結(jié)果。為了讓GPT 3初步具備理解指令中蘊(yùn)含的意圖,首先會(huì)從測(cè)試用戶提交的prompt(就是指令或問題)中隨機(jī)抽取一批,靠專業(yè)的標(biāo)注人員,給出指定prompt的高質(zhì)量答案,然后用這些人工標(biāo)注好的數(shù)據(jù)來Fine-tune GPT 3模型。經(jīng)過這個(gè)過程,我們可以認(rèn)為 GPT 3初步具備了理解人類prompt中所包含意圖,并根據(jù)這個(gè)意圖給出相對(duì)高質(zhì)量回答的能力,但是很明顯,僅僅這樣做是不夠的。

  第二階段:訓(xùn)練回報(bào)模型(RewardModel,RM)

  這個(gè)階段的主要目的是通過人工標(biāo)注訓(xùn)練數(shù)據(jù),來訓(xùn)練回報(bào)模型。具體而言,隨機(jī)抽樣一批用戶提交的prompt(大部分和第一階段的相同),使用第一階段Fine-tune好的冷啟動(dòng)模型,對(duì)于每個(gè)prompt,由冷啟動(dòng)模型生成K個(gè)不同的回答,于是模型產(chǎn)生出了,…。數(shù)據(jù)。之后,標(biāo)注人員對(duì)K個(gè)結(jié)果按照很多標(biāo)準(zhǔn)(上面提到的相關(guān)性、富含信息性、有害信息等諸多標(biāo)準(zhǔn))綜合考慮進(jìn)行排序,給出K個(gè)結(jié)果的排名順序,這就是此階段人工標(biāo)注的數(shù)據(jù)。接下來,我們準(zhǔn)備利用這個(gè)排序結(jié)果數(shù)據(jù)來訓(xùn)練回報(bào)模型,采取的訓(xùn)練模式其實(shí)就是平常經(jīng)常用到的pair-wiselearning to rank。對(duì)于K個(gè)排序結(jié)果,兩兩組合,形成 ( k 2 ) \binom{k}{2} (2k) 個(gè)訓(xùn)練數(shù)據(jù)對(duì),ChatGPT采取pair-wiseloss來訓(xùn)練Reward Model。RM模型接受一個(gè)輸入,給出評(píng)價(jià)回答質(zhì)量高低的回報(bào)分?jǐn)?shù)Score。對(duì)于一對(duì)訓(xùn)練數(shù)據(jù),我們假設(shè)人工排序中answer1排在answer2前面,那么Loss函數(shù)則鼓勵(lì)RM模型對(duì)的打分要比 的打分要高。歸納下:在這個(gè)階段里,首先由冷啟動(dòng)后的監(jiān)督策略模型為每個(gè)prompt產(chǎn)生K個(gè)結(jié)果,人工根據(jù)結(jié)果質(zhì)量由高到低排序,以此作為訓(xùn)練數(shù)據(jù),通過pair-wiselearning to rank模式來訓(xùn)練回報(bào)模型。對(duì)于學(xué)好的RM模型來說,輸入,輸出結(jié)果的質(zhì)量得分,得分越高說明產(chǎn)生的回答質(zhì)量越高。

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1NB-IoT芯片廠商的資料說明
  2. 0.31 MB   |  22次下載  |  1 積分
  3. 2智慧監(jiān)獄建設(shè)的核心終端—智慧監(jiān)倉(cāng)屏
  4. 0.25 MB   |  2次下載  |  免費(fèi)
  5. 3PC318C016M/D 200V半橋柵極驅(qū)動(dòng)器技術(shù)手冊(cè)
  6. 0.77 MB   |  2次下載  |  免費(fèi)
  7. 45.0SMDJ200A單向TVS瞬態(tài)抑制二極管規(guī)格書
  8. 0.88 MB   |  1次下載  |  免費(fèi)
  9. 5PC318C041EQ 200V半橋柵極驅(qū)動(dòng)器技術(shù)手冊(cè)
  10. 0.50 MB   |  次下載  |  免費(fèi)
  11. 6PC318C042NM 200V半橋柵極驅(qū)動(dòng)器技術(shù)手冊(cè)
  12. 0.55 MB   |  次下載  |  免費(fèi)
  13. 7技嘉H110主板IT8628E_BX IO電路圖資料
  14. 2.61 MB   |  次下載  |  1 積分
  15. 8H110主板CPU PWM芯片ISL95858HRZ-T核心供電電路圖資料
  16. 0.63 MB   |  次下載  |  1 積分

本月

  1. 1元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
  2. 6.40 MB  |  241次下載  |  免費(fèi)
  3. 2元宇宙底層硬件系列報(bào)告
  4. 13.42 MB  |  184次下載  |  免費(fèi)
  5. 32022 年展望報(bào)告 – 半導(dǎo)體產(chǎn)業(yè)
  6. 1.43 MB  |  136次下載  |  免費(fèi)
  7. 4晶振與濾波器應(yīng)用電路《電子工程師必備:元器件應(yīng)用寶典》
  8. 1.57 MB  |  90次下載  |  免費(fèi)
  9. 5汽車電子行業(yè)深度解析:智能化與電動(dòng)化方興未艾
  10. 6.47 MB  |  71次下載  |  免費(fèi)
  11. 6中國(guó)DPU行業(yè)白皮書
  12. 23.80 MB  |  37次下載  |  免費(fèi)
  13. 7晶科鑫代理線-微盟電子2021年度產(chǎn)品目錄選型手冊(cè)
  14. 14.75 MB  |  27次下載  |  免費(fèi)
  15. 8NB-IoT芯片廠商的資料說明
  16. 0.31 MB   |  22次下載  |  1 積分

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935137次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233089次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費(fèi)下載
  8. 340992  |  191425次下載  |  10 積分
  9. 5十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
  10. 158M  |  183352次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81602次下載  |  10 積分
  13. 7Keil工具M(jìn)DK-Arm免費(fèi)下載
  14. 0.02 MB  |  73822次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65991次下載  |  10 積分