資料介紹
建議挖掘作為一項新興研究任務(wù),具有重要的應(yīng)用價值。針對傳統(tǒng)建議語句分類方法所存在的規(guī)則復(fù)雜、標(biāo)注工作量大、特征維度高、數(shù)據(jù)稀疏等問題,提出一種基于PU學(xué)習(xí)的建議語句分類方法。首先,使用簡單規(guī)則從無標(biāo)注評論集合中選擇建議語句的正例集合;然后,為了降低特征維度,緩解數(shù)據(jù)稀疏性,在自編碼神經(jīng)網(wǎng)絡(luò)( Autoencoder)特征空間中使用Spy技術(shù)劃分可靠反例集合;最后,利用正例集合和可靠反例集合來訓(xùn)練多層感知機(jī)(MLP)對剩余的無標(biāo)注樣例進(jìn)行分類。該方法在中文數(shù)據(jù)集上的F1值和準(zhǔn)確率值分別達(dá)到81. 98%和82. 67% ,實驗結(jié)果表明,該方法能夠有效地對建議語句進(jìn)行分類,且不需要對數(shù)據(jù)進(jìn)行人工標(biāo)注。
隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)上出現(xiàn)了海量的用戶評論,人們不僅會在評論中傳達(dá)積極或消極的情緒,有時也會對產(chǎn)品、服務(wù)等提出相應(yīng)的建議。例如,在“希望三星手機(jī)能支持谷歌應(yīng)用商店”這條評論中雖然并未包含情感極性,但明確提出了對產(chǎn)品功能的改進(jìn)建議。這類建議信息可以幫助廠家有效地提升產(chǎn)品質(zhì)量,也有助于商家有針對性地制定銷售策略,具有重要的應(yīng)用價值,建議挖掘”研究因此應(yīng)運而生。
進(jìn)行建議挖掘,首先需要對建議語句進(jìn)行分類,即將評論語句分為建議語句或非建議語句。但由于人們對建議的判定存在比較大的主觀性,導(dǎo)致建議語句的定義難以取得-致,這給語料標(biāo)注和問題定義帶來了很多困難“。本文采用和文獻(xiàn)[1]類似的方案,將明確表達(dá)了期望或提出改進(jìn)意見的語句定義為建議語句。目前,建議挖掘研究l2-71雖然已經(jīng)取得了一定的進(jìn)展,但還存在以下問題:- -方面,已有研究大多是在英文語料上開展的,在中文語料上的相關(guān)研究很少,而中文環(huán)境和英語環(huán)境中的網(wǎng)絡(luò)文化和建議語句的表達(dá)方式存在較大差異,因此需要深入研究中文環(huán)境下的建議語句分類方法。另- -方面,在已有研究中,用于建議語句分類的方法主要有規(guī)則方法[-31和有監(jiān)督機(jī)器學(xué)習(xí)方法[4-7]。規(guī)則方法通過手工制定的規(guī)則來進(jìn)行建議挖掘,需要提前建立復(fù)雜的規(guī)則模板,人工干預(yù)較多。而有監(jiān)督機(jī)器學(xué)習(xí)方法雖然模型的精度較高,但模型訓(xùn)練過程中需要大量人工標(biāo)注語料,標(biāo)注工作量大,代價昂貴,并面臨特征維度高、數(shù)據(jù)稀疏等問題。

- 使用深度學(xué)習(xí)方法對音樂流派進(jìn)行分類
- 基于CNN分類回歸聯(lián)合學(xué)習(xí)等的左心室檢測方法 33次下載
- 基于LSTM的表示學(xué)習(xí)-文本分類模型 18次下載
- 基于主題分布優(yōu)化的模糊文本分類方法 5次下載
- 一種基于Q學(xué)習(xí)算法的增量分類模型 3次下載
- 一種基于DE和ELM的半監(jiān)督分類方法 5次下載
- 最大化AUC關(guān)系的PU分類應(yīng)用及相關(guān)算法 12次下載
- 基于深度神經(jīng)網(wǎng)絡(luò)的文本分類分析 37次下載
- 如何使用SQL修復(fù)語句程序說明 5次下載
- SQL的經(jīng)典語句用法詳細(xì)說明 5次下載
- 如何結(jié)合改進(jìn)主動學(xué)習(xí)的SVD-CNN進(jìn)行彈幕文本分類算法資料說明 6次下載
- 如何進(jìn)行網(wǎng)絡(luò)背景流量的分類與識別的詳細(xì)資料說明 7次下載
- C++程序設(shè)計教程之語句的詳細(xì)資料說明 1次下載
- 使用深度模型遷移進(jìn)行細(xì)粒度圖像分類的方法說明 5次下載
- 集成學(xué)習(xí)的多分類器動態(tài)組合方法
- 深度學(xué)習(xí)中的時間序列分類方法 2.9k次閱讀
- assign語句和always語句的用法 4.7k次閱讀
- 詳解Verilog賦值語句、塊語句、條件語句 8.9k次閱讀
- 什么是SystemVerilog-決策語句-if-else語句? 2.1k次閱讀
- 動態(tài)追蹤技術(shù)分類及其使用方法 4.1k次閱讀
- 基本語句編程的一些規(guī)則和建議 2.1k次閱讀
- Verilog進(jìn)行組合邏輯設(shè)計時的注意事項 2.8k次閱讀
- 最實用的SQL語句快來收藏學(xué)習(xí)吧 3.7k次閱讀
- 為什么學(xué)習(xí)深度學(xué)習(xí)需要使用PyTorch和TensorFlow框架 3.9k次閱讀
- 如何吧垃圾代碼進(jìn)行垃圾分類詳細(xì)指南說明 4.4k次閱讀
- 如何開始接觸機(jī)器學(xué)習(xí)_機(jī)器學(xué)習(xí)入門方法盤點 4.5k次閱讀
- 機(jī)器學(xué)習(xí)應(yīng)用中的常見問題分類問題你了解多少 1.6w次閱讀
- 解析圖像分類器結(jié)構(gòu)搜索的正則化異步進(jìn)化方法 并和強(qiáng)化學(xué)習(xí)方法進(jìn)行對比 4.4k次閱讀
- 基于概率的常見的分類方法--樸素貝葉斯 5.8k次閱讀
- 機(jī)器學(xué)習(xí)所負(fù)責(zé)的任務(wù)的分類方法介紹 2.7k次閱讀
下載排行
本周
- 1PD取電芯片 ECP5702規(guī)格書
- 0.88 MB | 3次下載 | 免費
- 2氮化鎵GaN FET/GaN HEMT 功率驅(qū)動電路選型表
- 0.10 MB | 2次下載 | 免費
- 3EMC PCB設(shè)計總結(jié)
- 0.33 MB | 2次下載 | 免費
- 41節(jié)電池用電池保護(hù)IC S-8261D系列數(shù)據(jù)手冊
- 3.07 MB | 1次下載 | 1 積分
- 5PD取電芯片,可取5/9/12/15/20V電壓ECP5702數(shù)據(jù)手冊
- 0.88 MB | 1次下載 | 免費
- 6飛騰FT2000-4 COM Express核心板技術(shù)手冊0603
- 1.22 MB | 1次下載 | 免費
- 7飛騰S5000C-64雙路服務(wù)器系列應(yīng)用宣傳冊--一乘科技
- 945.81 KB | 1次下載 | 免費
- 8IP2345支持PD3.0等多種快充協(xié)議 支持4~6節(jié)串聯(lián)電池最大充電功率30W異步升降壓充電IC
- 1.41 MB | 次下載 | 免費
本月
- 1美的電磁爐電路原理圖資料
- 4.39 MB | 22次下載 | 10 積分
- 2反激式開關(guān)電源設(shè)計解析
- 0.89 MB | 16次下載 | 5 積分
- 3耗盡型MOS FET產(chǎn)品目錄選型表
- 0.14 MB | 3次下載 | 免費
- 4PD取電芯片 ECP5702規(guī)格書
- 0.88 MB | 3次下載 | 免費
- 5氮化鎵GaN FET/GaN HEMT 功率驅(qū)動電路選型表
- 0.10 MB | 2次下載 | 免費
- 6EMC PCB設(shè)計總結(jié)
- 0.33 MB | 2次下載 | 免費
- 7PC5200 700V_10A GaN HEMT驅(qū)動器數(shù)據(jù)手冊
- 1.63 MB | 1次下載 | 免費
- 81節(jié)電池用電池保護(hù)IC S-8261D系列數(shù)據(jù)手冊
- 3.07 MB | 1次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233095次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191457次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183360次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81605次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費下載
- 0.02 MB | 73831次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論