chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

解決長尾和冷啟動問題的基本方法

深度學(xué)習(xí)自然語言處理 ? 來源:圓圓的算法筆記 ? 作者:圓圓的算法筆記 ? 2022-09-05 14:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1什么是長尾問題

長尾問題一直是很多場景中最難優(yōu)化的問題,特別是在推薦系統(tǒng)領(lǐng)域,長尾問題十分常見,卻很難優(yōu)化。在推薦系統(tǒng)中,長尾問題指的是,某些實體在訓(xùn)練數(shù)據(jù)中出現(xiàn)次數(shù)非常少,導(dǎo)致模型對這部分樣本打分效果很差。典型的場景包括,新用戶沒有幾條瀏覽行為,如何準(zhǔn)確推薦用戶感興趣的內(nèi)容;一些商品非常小眾,用戶反饋很少,如何對這些商品進行推薦等等。長尾在一個成熟的系統(tǒng)中往往服從二八定律,即20%的頭部實體貢獻了80%的數(shù)據(jù),而剩余80%的實體只有20%的數(shù)據(jù),實際場景中甚至比二八還要長尾。

長尾問題的難點主要體現(xiàn)在以下2點。首先,長尾實體的樣本量太少,模型很難學(xué)習(xí)這部分樣本的規(guī)律,例如用戶的embedding、商品的embedding等,都是需要大量數(shù)據(jù)學(xué)習(xí)的。其次,頭部樣本在數(shù)量上占絕對優(yōu)勢,導(dǎo)致模型偏向擬合頭部樣本的規(guī)律,而尾部樣本的規(guī)律和頭部樣本可能有較大差異,導(dǎo)致模型在尾部樣本效果不好。

2如何解決長尾問題

那么,如何解決長尾問題呢?業(yè)內(nèi)工作主要包括兩種核心優(yōu)化方法。第一種方法是基于meta-learning解決長尾問題。剛才我們說到,長尾用戶或商品的數(shù)據(jù)量少,模型難學(xué)習(xí),那么我們就讓模型具備在少量樣本上能學(xué)的比較好的能力就可以了。而meta-learning正是讓模型實現(xiàn)上述能力的方法。我在之前的文章Meta-learning核心思想及近年頂會3個優(yōu)化方向中對meta-learning的核心思路進行了詳細介紹,感興趣的同學(xué)可以進一步深入閱讀。第二種方法是基于圖學(xué)習(xí)解決長尾問題。長尾部分的由于數(shù)據(jù)少無法學(xué)到良好的embedding,在圖學(xué)習(xí)中,可以利用豐富的鄰居節(jié)點信息對長尾實體的信息進行補充,進而學(xué)到更好的embedding。

下面,我們分別來看看基于meta-learning的方法和基于圖學(xué)習(xí)的方法解決長尾問題的典型工作。

3基于meta-learning的方法

基于meta-learning的長尾問題解決方法又可以分為兩種思路,一種是利用meta-learning生成長尾用戶或商品的良好embedding,另一種是利用meta-learning讓模型獲得在小樣本上的快速學(xué)習(xí)能力。這里分別介紹兩個思路的兩篇經(jīng)典文章。

第一篇文章是Improving ctr predictions via learning to learn id embeddings(SIGIR 2019)。這篇文章主要場景是廣告的ctr預(yù)估,解決的問題是如何提升冷啟動廣告的預(yù)測效果。本文提出了基于meta-learning的冷啟動廣告embedding學(xué)習(xí)方法。首先將每個ad的ctr預(yù)測看成是meta-learning中一個獨立的任務(wù)。然后學(xué)習(xí)一個embedding生成器,生成器的輸入是廣告的特征,輸出embedding。整個過程利用meta-learning的思路進行學(xué)習(xí),利用meta-learning中的support set和query set模擬一個冷啟動廣告生成embedding和使用embedding預(yù)測,進而優(yōu)化embedding生成器。

b9d71712-2cd9-11ed-ba43-dac502259ad0.png

整個meta-learning的過程如下所示,在一個預(yù)訓(xùn)練好的模型基礎(chǔ)上進行。隨機選擇一些廣告,生成兩個batch的數(shù)據(jù)。使用embedding生成器生成embedding后使用第一個batch計算loss,再利用這個loss更新一步生成器(內(nèi)循環(huán));然后使用更新后的生成器計算另一個batch上的loss(外循環(huán)),并更新最終參數(shù)。

b9ee5b16-2cd9-11ed-ba43-dac502259ad0.png

第二篇文章是MeLU: meta-learned user preference estimator for cold-start recommendation(KDD 2019)。這篇文章主要也是借助了meta-learning讓模型具有快速學(xué)習(xí)能力,讓模型能夠在冷啟動樣本上,只看到少數(shù)幾個item就能進行快速的更新參數(shù)。

ba01e0aa-2cd9-11ed-ba43-dac502259ad0.png

這篇文章重點解決的是user側(cè)的冷啟動問題,對于一個user的數(shù)據(jù)分成support set和query set,在support set內(nèi)循環(huán)后在queryset評估效果并進行全局更新。embedding層不使用meta-learning,只在全連接層進行meta-learning。

ba18ba14-2cd9-11ed-ba43-dac502259ad0.png

4基于圖學(xué)習(xí)的方法

基于圖的學(xué)習(xí)方法通過圖建立不同實體之間的關(guān)系,進而可以用其他實體的信息豐富長尾實體的信息,緩解由于長尾導(dǎo)致的樣本不充分無法學(xué)習(xí)良好表示的問題。

Learning Graph Meta Embeddings for Cold-Start Ads in Click-Through Rate Prediction(SIGIR 2021)利用圖學(xué)習(xí)解決新ad的embedding生成問題。對于新ad,使用屬性特征和圖學(xué)習(xí)生成一個合理的embedding。根據(jù)屬性重合度構(gòu)造新ad的相似鄰居,并按照屬性的重合度排序,得到最相似的幾個ad。然后利用GAT進行new ad和其鄰居的信息融合,再用全連接生成新ad的向量表示,作為id embedding。這個過程相當(dāng)于根據(jù)屬性找到與新ad最相似的舊ad,用舊ad的信息豐富新ad的embedding。在訓(xùn)練方法上,先用舊ad訓(xùn)練一個正常的ctr預(yù)估模型,然后固定ctr模型的參數(shù),單獨訓(xùn)練新ad表示生成部分的參數(shù),利用meta-learning的方法更新模型參數(shù)。

ba3e8a78-2cd9-11ed-ba43-dac502259ad0.png

Graph Intention Network for Click-through Rate Prediction in Sponsored Search(SIGIR 2019)也是一篇比較有代表性的工作。CTR預(yù)估中經(jīng)常需要對歷史行為建模提升效果(比如用戶歷史點擊過的商品),但是長尾用戶的歷史行為比較稀疏。因此這篇文章提出,利用點擊行為構(gòu)造商品和商品之間的圖,利用這個圖補充歷史行為信息。通過商品-商品圖,可以挖掘出和當(dāng)前商品高度相關(guān)的其他商品,這些商品雖然沒有直接的點擊行為,但由于和點擊過的商品高度相關(guān),因此用戶點擊這些商品的概率可能也很高。通過這種基于圖擴展信息的方法,解決長尾用戶歷史行為稀疏的問題。

ba529e64-2cd9-11ed-ba43-dac502259ad0.png

5總結(jié)

本文為大家介紹了解決長尾和冷啟動問題的基本方法,主要包括meta-learning和圖學(xué)習(xí)兩個路線。Meta-learning更側(cè)重于讓模型具有在小樣本上快速學(xué)習(xí)的能力;而圖學(xué)習(xí)更側(cè)重于挖掘和長尾實體相關(guān)的鄰居,用鄰居信息補充長尾實體的信息。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7317

    瀏覽量

    94108
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3656

    瀏覽量

    51793
  • 生成器
    +關(guān)注

    關(guān)注

    7

    文章

    322

    瀏覽量

    22530

原文標(biāo)題:長尾預(yù)測效果不好怎么辦?試試這兩種思路

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    法拉電容在汽車上的應(yīng)用有哪些

    法拉電容提升汽車電力系統(tǒng)性能,穩(wěn)定音響輸出、應(yīng)對冷啟動及擁堵路況,成為高效能替代方案。
    的頭像 發(fā)表于 12-17 09:28 ?67次閱讀
    法拉電容在汽車上的應(yīng)用有哪些

    HarmonyOSAI編程智慧調(diào)優(yōu)

    Beta1版本開始支持。 注意 當(dāng)前支持對Launch冷啟動問題和Frame卡頓丟幀問題進行智慧調(diào)優(yōu)分析。 Profiler工具中已集成智慧調(diào)優(yōu)能力,首次使用請先根據(jù)界面提示完成CodeGenie授權(quán)登陸
    發(fā)表于 09-01 15:15

    HarmonyOS AI輔助編程工具(CodeGenie)智慧調(diào)優(yōu)

    Beta1版本開始支持。 注意 當(dāng)前支持對Launch冷啟動問題和Frame卡頓丟幀問題進行智慧調(diào)優(yōu)分析。 Profiler工具中已集成智慧調(diào)優(yōu)能力,首次使用請先根據(jù)界面提示完成CodeGenie授權(quán)登陸
    發(fā)表于 08-14 11:12

    無位置傳感器無刷直流電機啟動的新方法研究

    摘 要:針對無位置傳感器無刷直流電機的啟動問題,提出了對三段式閉環(huán)啟動中的預(yù)定位,外加速過程的改進方法。在轉(zhuǎn)子定位階段采用基于空間電壓矢量調(diào)制的短時脈沖來獲得轉(zhuǎn)子初始位置,精度可達15”。加速階段
    發(fā)表于 07-10 16:37

    無位置傳感器無刷直流電機閉環(huán)三段式啟動策略

    摘 要:針對無位置傳感器無刷直流電機(brshiess DC moor,BLDCM)啟動問題,提出了一種轉(zhuǎn)子初始位置精準(zhǔn)預(yù)定位與加速過程中優(yōu)化定位相結(jié)合的閉環(huán)三段式啟動策略。在電機繞組中施加短時間
    發(fā)表于 07-09 14:26

    【HarmonyOS 5】鴻蒙中的UIAbility詳解(三)

    詳解系列的最終章。主要針對UIAbility的冷啟動和熱啟動,對于want數(shù)據(jù)的處理。UIAbility的備份恢復(fù),UIAbility的接續(xù)等高級功能的概念和使用講解。 二、UIAbility啟動模式
    的頭像 發(fā)表于 06-14 22:32 ?524次閱讀

    解析無感方波算法與平滑啟動算法在小風(fēng)扇驅(qū)動方案中的應(yīng)用與優(yōu)勢--【其利天下】

    理及適應(yīng)性等方面,以下是詳細剖析:▲市面上小風(fēng)扇一、啟動問題單相無刷電機因定轉(zhuǎn)子磁場特性,存在啟動死點。當(dāng)扇葉停在電磁轉(zhuǎn)矩零點時,電機難以自行啟動,需手動撥動。此外,
    的頭像 發(fā)表于 06-13 18:02 ?491次閱讀
    解析無感方波算法與平滑<b class='flag-5'>啟動</b>算法在小風(fēng)扇驅(qū)動方案中的應(yīng)用與優(yōu)勢--【其利天下】

    鴻蒙5開發(fā)寶藏案例分享---冷啟動優(yōu)化案例分享

    程 ?非必要資源延遲加載 ?首屏數(shù)據(jù)本地緩存優(yōu)先 優(yōu)化后我們的應(yīng)用冷啟動速度提升300%+!這些寶藏案例都在官方性能優(yōu)化文檔中,強烈建議大家仔細研究。 最后送大家一句話 :性能優(yōu)化不是玄學(xué),用對工具+用對方法=用戶體驗飆升!遇到坑點歡迎在評論區(qū)交流討論? **覺得有用記得
    發(fā)表于 06-12 17:22

    電機常見的噪音、振動問題及解決方法

    ,甚至引發(fā)安全隱患。本文將系統(tǒng)分析電機常見的噪音和振動問題,并提供切實可行的解決方法。 ? 一、電機噪音問題及解決方法 電機噪音主要來源于電磁噪音、機械噪音和空氣動力噪音三個方面。 1. 電磁噪音 電磁噪音是由于電機內(nèi)部
    的頭像 發(fā)表于 06-08 10:25 ?2494次閱讀

    多個i.MXRT共享一顆Flash啟動方法與實踐(下)

    在 《多個i.MXRT共享一顆Flash啟動方法與實踐(上)》 一文里痞子衡給大家從理論上介紹一種多 i.MXRT 共享 Flash 啟動方法,但是理論雖好,如果沒有經(jīng)過實踐驗證切
    的頭像 發(fā)表于 06-05 10:04 ?1049次閱讀
    多個i.MXRT共享一顆Flash<b class='flag-5'>啟動</b>的<b class='flag-5'>方法</b>與實踐(下)

    電機重啟動的控制策略

    為了解決高壓大容量變頻器調(diào)速異步電機失電后的重啟動問題,本文作者曾經(jīng)采用過直流側(cè)最小電流法、交流側(cè)最小電流法等多種控制方法檢測轉(zhuǎn)子轉(zhuǎn)速。在現(xiàn)場應(yīng)用中,發(fā)現(xiàn)這些方法存在提取信號困難、數(shù)據(jù)量大以及穩(wěn)定性
    發(fā)表于 05-27 16:23

    拯救你的樹莓派!無法啟動不用慌!

    當(dāng)你的樹莓派無法啟動時,是不是很苦惱呢?別擔(dān)心,今天我就來給大家分享一個超實用的解決方法。這篇文章提供了詳細的解決方案,讓你的樹莓派重新煥發(fā)生機。無論是硬件問題還是軟件故障,都能在這里找到對應(yīng)
    的頭像 發(fā)表于 03-25 09:34 ?6623次閱讀
    拯救你的樹莓派!無法<b class='flag-5'>啟動</b>不用慌!

    如果系統(tǒng)日志顯示驅(qū)動問題,我該怎么辦?

    如果系統(tǒng)日志顯示驅(qū)動問題,您可以按照以下步驟進行排查和解決: 1.檢查內(nèi)核日志 使用 dmesg 命令查看內(nèi)核日志,過濾出與驅(qū)動相關(guān)的錯誤信息: ? sudo dmesg | grep -iE
    的頭像 發(fā)表于 01-20 17:38 ?1212次閱讀

    鴻蒙原生頁面高性能解決方案上線OpenHarmony社區(qū) 助力打造高性能原生應(yīng)用

    Nodepool、HMrouter和DataCache 三大解決方案,并上架OpenHarmony開源社區(qū)分,分別針對應(yīng)用頁面滑動、跳轉(zhuǎn)、首頁冷啟動等關(guān)鍵性能場景提供高效易用的工具,助力伙伴和開發(fā)者打造
    發(fā)表于 01-02 18:00

    如何降低半導(dǎo)體制造無塵車間設(shè)備振動問題的影響?

    要降低無塵車間設(shè)備振動問題的影響,需要從設(shè)備選型與安裝、振動監(jiān)測與控制、車間環(huán)境管理等方面綜合采取措施,以下是具體方法
    的頭像 發(fā)表于 01-02 15:23 ?1782次閱讀
    如何降低半導(dǎo)體制造無塵車間設(shè)備振<b class='flag-5'>動問</b>題的影響?