chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何將機(jī)器學(xué)習(xí)模型的準(zhǔn)確性從80%提高到90%以上

電子設(shè)計(jì) ? 來源: 電子設(shè)計(jì) ? 作者: 電子設(shè)計(jì) ? 2020-12-10 14:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)科學(xué)工作通常需要大幅度提高工作量才能提高所開發(fā)模型的準(zhǔn)確性。這五個(gè)建議將有助于改善您的機(jī)器學(xué)習(xí)模型,并幫助您的項(xiàng)目達(dá)到其目標(biāo)。

如果您已經(jīng)完成了一些自己的數(shù)據(jù)科學(xué)項(xiàng)目,那么您現(xiàn)在可能已經(jīng)意識(shí)到,達(dá)到80%的準(zhǔn)確性還不錯(cuò)!但是在現(xiàn)實(shí)世界中,有80%不會(huì)削減它。實(shí)際上,我工作過的大多數(shù)公司都期望至少90%的最低準(zhǔn)確性(或他們所關(guān)注的任何度量標(biāo)準(zhǔn))。
因此,我將討論可以極大地提高準(zhǔn)確性的5件事。 我強(qiáng)烈建議您仔細(xì)閱讀所有五點(diǎn)內(nèi)容, 因?yàn)槠渲邪嗽S多大多數(shù)初學(xué)者都不知道的細(xì)節(jié)。
到此為止,您應(yīng)該理解,在決定機(jī)器學(xué)習(xí)模型的性能方面,有比您想象的更多的變量。
話雖如此,您可以做以下五件事來改善您的機(jī)器學(xué)習(xí)模型!

1.處理缺失值

我看到的最大錯(cuò)誤之一是人們?nèi)绾翁幚砣笔У膬r(jià)值觀,這不一定是他們的錯(cuò)。網(wǎng)絡(luò)上有很多資料說,您通常通過均值插補(bǔ)來處理缺失值 , 將空值替換為給定特征的均值,這通常不是最佳方法。
例如,假設(shè)我們有一個(gè)顯示年齡和健身得分的表,并且假設(shè)一個(gè)八十歲的孩子缺少健身得分。如果我們將平均健身得分從15到80歲的年齡范圍內(nèi)進(jìn)行計(jì)算,那么八十歲的孩子似乎將獲得比他們實(shí)際應(yīng)該更高的健身得分。
因此,您要問自己的第一個(gè)問題是 為什么 數(shù)據(jù)一開始會(huì)丟失。

接下來,考慮除均值/中位數(shù)插補(bǔ)外的其他處理丟失數(shù)據(jù)的方法:
特征預(yù)測(cè)建模:回到我關(guān)于年齡和健身得分的示例,我們可以對(duì)年齡和健身得分之間的關(guān)系進(jìn)行建模,然后使用該模型查找給定年齡的預(yù)期健身得分。這可以通過多種技術(shù)來完成,包括回歸,ANOVA等。

K最近鄰插補(bǔ):使用KNN插補(bǔ),缺失數(shù)據(jù)中填充了另一個(gè)相似樣本中的值,對(duì)于不知道的數(shù)據(jù),KNN中的相似性使用距離函數(shù)(即歐幾里德距離)確定。

刪除行:最后,您可以刪除該行。通常不建議這樣做,但是當(dāng)您有大量數(shù)據(jù)開始時(shí),它是可以接受的 。

2.特征工程

可以顯著改善機(jī)器學(xué)習(xí)模型的第二種方法是通過特征工程。特征工程是將原始數(shù)據(jù)轉(zhuǎn)換為更好地表示人們正在試圖解決的潛在問題的特征的過程。沒有具體的方法可以執(zhí)行此步驟,這就是使數(shù)據(jù)科學(xué)與科學(xué)一樣多的藝術(shù)。話雖如此,以下是您可以考慮的一些事項(xiàng):

轉(zhuǎn)換DateTime變量以僅提取一周中的一天,一年中的月份等。

為變量創(chuàng)建箱或桶。(例如,對(duì)于高度變量,可以為100–149厘米,150–199厘米,200–249厘米等)

組合多個(gè)功能和/或值以創(chuàng)建一個(gè)新功能。例如,針對(duì)泰坦尼克號(hào)挑戰(zhàn)的最準(zhǔn)確模型之一設(shè)計(jì)了一個(gè)新變量“ Is_women_or_child”,如果該人是女人還是孩子,則為True,否則為false。

3.特征選擇

可以大大提高模型準(zhǔn)確性的第三個(gè)領(lǐng)域是特征選擇,即選擇數(shù)據(jù)集中最相關(guān)/最有價(jià)值的特征。特征太多會(huì)導(dǎo)致算法過擬合,而特征太少會(huì)導(dǎo)致算法不足。

我喜歡使用兩種主要方法來幫助您選擇功能:

功能重要性:某些算法(例如隨機(jī)森林或XGBoost)可讓您確定哪些功能在預(yù)測(cè)目標(biāo)變量的值時(shí)最“重要”。通過快速創(chuàng)建這些模型之一并進(jìn)行功能重要性,您將了解哪些變量比其他變量更有用。

降維:主成分分析(PCA)是最常見的降維技術(shù)之一,它具有大量特征,并使用線性代數(shù)將其簡(jiǎn)化為更少的特征。

4.集成學(xué)習(xí)算法

改善機(jī)器學(xué)習(xí)模型的最簡(jiǎn)單方法之一就是簡(jiǎn)單地選擇更好的機(jī)器學(xué)習(xí)算法。如果您還不知道什么是集成學(xué)習(xí)算法,那么現(xiàn)在該學(xué)習(xí)它了!
集合學(xué)習(xí) 是一種結(jié)合使用多種學(xué)習(xí)算法的方法。這樣做的目的是,與單獨(dú)使用單個(gè)算法相比,它可以實(shí)現(xiàn)更高的預(yù)測(cè)性能。
流行的整體學(xué)習(xí)算法包括隨機(jī)森林,XGBoost,梯度提升和AdaBoost。為了解釋為什么集成學(xué)習(xí)算法如此強(qiáng)大,我將以隨機(jī)森林為例:

隨機(jī)森林涉及使用原始數(shù)據(jù)的自舉數(shù)據(jù)集創(chuàng)建多個(gè)決策樹。然后,模型選擇每個(gè)決策樹的所有預(yù)測(cè)的模式(多數(shù))。這有什么意義?通過依靠“多數(shù)勝利”模型,它降低了單個(gè)樹出錯(cuò)的風(fēng)險(xiǎn)。

例如,如果我們創(chuàng)建一個(gè)決策樹,第三個(gè)決策樹,它將預(yù)測(cè)0。但是,如果我們依靠所有4個(gè)決策樹的模式,則預(yù)測(cè)值為1。這就是集成學(xué)習(xí)的力量!

5.調(diào)整超參數(shù)

最后,調(diào)整模型的超參數(shù)并不經(jīng)常被談?wù)?,但仍然非常重要。在這里,必須清楚地了解正在使用的ML模型。否則,可能很難理解每個(gè)超參數(shù)。

看一下隨機(jī)森林的所有超參數(shù):

class sklearn.ensemble.RandomForestClassifier(n_estimators=100, *, criterion='gini', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features='auto', max_leaf_nodes=None, min_impurity_decrease=0.0, min_impurity_split=None, bootstrap=True, oob_score=False, n_jobs=None, random_state=None, verbose=0, warm_start=False, class_weight=None, ccp_alpha=0.0, max_samples=None)

例如,了解什么是min_impurity_decrease可能是一個(gè)好主意,這樣,當(dāng)您希望機(jī)器學(xué)習(xí)模型更加寬容時(shí),可以調(diào)整此參數(shù)!;)

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4781

    瀏覽量

    97970
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8551

    瀏覽量

    136836
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于ETAS嵌入式AI工具鏈機(jī)器學(xué)習(xí)模型部署量產(chǎn)ECU

    AI在汽車行業(yè)的應(yīng)用日益深化,如何將機(jī)器學(xué)習(xí)領(lǐng)域的先進(jìn)模型(如虛擬傳感器)集成ECU軟件中,已成為業(yè)界面臨的核心挑戰(zhàn)。
    的頭像 發(fā)表于 12-24 10:55 ?5893次閱讀
    基于ETAS嵌入式AI工具鏈<b class='flag-5'>將</b><b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>模型</b>部署<b class='flag-5'>到</b>量產(chǎn)ECU

    如何確保電能質(zhì)量在線監(jiān)測(cè)裝置運(yùn)行日志的準(zhǔn)確性

    電能質(zhì)量在線監(jiān)測(cè)裝置運(yùn)行日志的準(zhǔn)確性直接影響故障溯源、合規(guī)審計(jì)和運(yùn)維決策,需 “數(shù)據(jù)采集源頭、記錄過程、存儲(chǔ)傳輸、校驗(yàn)維護(hù)、管理流程” 五大維度構(gòu)建閉環(huán)保障體系,結(jié)合技術(shù)手段與行業(yè)標(biāo)準(zhǔn),實(shí)現(xiàn)日志
    的頭像 發(fā)表于 12-17 11:08 ?542次閱讀
    如何確保電能質(zhì)量在線監(jiān)測(cè)裝置運(yùn)行日志的<b class='flag-5'>準(zhǔn)確性</b>?

    確保X光設(shè)備檢測(cè)的有效準(zhǔn)確性的關(guān)鍵技巧

    行業(yè)關(guān)注的重點(diǎn)。本文圍繞“X光設(shè)備檢測(cè)有效”和“X光檢測(cè)準(zhǔn)確性提升”這兩個(gè)核心長(zhǎng)尾關(guān)鍵詞,深入解析5個(gè)關(guān)鍵技巧,幫助企業(yè)提升設(shè)備性能,降低誤差率,滿足更高的檢測(cè)需求。無論是制造業(yè)的質(zhì)量控制還是安全檢查場(chǎng)景,
    的頭像 發(fā)表于 11-18 11:27 ?361次閱讀

    如何降低環(huán)境干擾強(qiáng)度對(duì)諧波檢測(cè)設(shè)備準(zhǔn)確性的影響?

    ? 降低環(huán)境干擾強(qiáng)度對(duì)諧波檢測(cè)設(shè)備準(zhǔn)確性的影響,需圍繞 “ 阻斷干擾傳播路徑→優(yōu)化設(shè)備自身抗擾能力→修正干擾導(dǎo)致的誤差→合理布局規(guī)避干擾 ” 四大核心思路,硬件防護(hù)、信號(hào)處理、安裝布局、設(shè)備
    的頭像 發(fā)表于 10-13 17:32 ?958次閱讀

    電能質(zhì)量在線監(jiān)測(cè)裝置的精度等級(jí)對(duì)其測(cè)量結(jié)果的準(zhǔn)確性有何影響?

    級(jí)),誤差限值寬松,準(zhǔn)確性越低。這種影響體現(xiàn)在 所有關(guān)鍵監(jiān)測(cè)參數(shù) (穩(wěn)態(tài)參數(shù)如電壓、諧波,暫態(tài)參數(shù)如暫降幅值)中,且隨應(yīng)用場(chǎng)景的風(fēng)險(xiǎn)等級(jí)(如貿(mào)易結(jié)算、故障溯源)放大差異。以下 “參數(shù)維度、場(chǎng)景維度、技術(shù)本質(zhì)” 三方面詳細(xì)解
    的頭像 發(fā)表于 09-26 17:40 ?1275次閱讀

    電能質(zhì)量在線監(jiān)測(cè)裝置定位諧波源的準(zhǔn)確性有多高?

    網(wǎng)、測(cè)點(diǎn)密集、同步精準(zhǔn)),準(zhǔn)確性可達(dá)到 90% 以上;在復(fù)雜場(chǎng)景(如廣域電網(wǎng)、背景諧波波動(dòng)大、測(cè)點(diǎn)稀疏),準(zhǔn)確性可能降至 70% 以下。以下
    的頭像 發(fā)表于 09-26 15:20 ?563次閱讀

    如何保障電能質(zhì)量監(jiān)測(cè)裝置的準(zhǔn)確性?

    保障電能質(zhì)量監(jiān)測(cè)裝置(以下簡(jiǎn)稱 “裝置”)的準(zhǔn)確性,需貫穿其 “ 選型→安裝→運(yùn)行維護(hù)→校準(zhǔn)→報(bào)廢 ” 全生命周期,核心是通過 “ 源頭把控硬件精度、過程規(guī)避干擾與退化、定期驗(yàn)證與修正 ”,確保裝置
    的頭像 發(fā)表于 09-23 16:03 ?883次閱讀

    如何保證數(shù)據(jù)校驗(yàn)系統(tǒng)的時(shí)間同步以提高準(zhǔn)確性

    在電能質(zhì)量監(jiān)測(cè)的數(shù)據(jù)校驗(yàn)系統(tǒng)中, 時(shí)間同步的準(zhǔn)確性直接決定了多監(jiān)測(cè)點(diǎn)數(shù)據(jù)的時(shí)空一致、暫態(tài)事件的時(shí)序匹配度,以及校驗(yàn)結(jié)果的可信度 。要保證時(shí)間同步以提升數(shù)據(jù)校驗(yàn)準(zhǔn)確性,需 “協(xié)議選擇
    的頭像 發(fā)表于 09-19 11:28 ?618次閱讀

    電能質(zhì)量監(jiān)測(cè)中,有哪些方法可以提高數(shù)據(jù)校驗(yàn)系統(tǒng)的準(zhǔn)確性?

    在電能質(zhì)量監(jiān)測(cè)中,數(shù)據(jù)校驗(yàn)系統(tǒng)的準(zhǔn)確性是保障監(jiān)測(cè)數(shù)據(jù)可信度的核心,需 “標(biāo)準(zhǔn)源精度、校準(zhǔn)流程、硬件適配、算法優(yōu)化、時(shí)間同步、運(yùn)維管理” 等多維度構(gòu)建提升方案,針對(duì)解決 “信號(hào)失真、參數(shù)偏差、環(huán)境
    的頭像 發(fā)表于 09-19 10:03 ?600次閱讀

    如何設(shè)置高轉(zhuǎn)換速率控制寄存器SPI頻率提高到36 MHz而不引起波形失真?

    如何設(shè)置高轉(zhuǎn)換速率控制寄存器,SPI頻率提高到36 MHz而不引起波形失真?
    發(fā)表于 08-28 07:23

    如何設(shè)置高轉(zhuǎn)換速率控制寄存器,SPI頻率提高到36 MHz而不引起波形失真?

    如何設(shè)置高轉(zhuǎn)換速率控制寄存器,SPI頻率提高到36 MHz而不引起波形失真
    發(fā)表于 08-21 07:33

    測(cè)縫計(jì)測(cè)量數(shù)據(jù)的準(zhǔn)確性和校準(zhǔn)方法解析

    在結(jié)構(gòu)物安全監(jiān)測(cè)領(lǐng)域,數(shù)據(jù)準(zhǔn)確性是評(píng)估工程健康狀態(tài)的核心依據(jù)。振弦式測(cè)縫計(jì)作為主流裂縫監(jiān)測(cè)設(shè)備,其測(cè)量精度直接影響裂縫發(fā)展趨勢(shì)的判斷。那么如何確保測(cè)縫計(jì)測(cè)量數(shù)據(jù)的準(zhǔn)確性以及如何校準(zhǔn)?下面是南京峟思給
    的頭像 發(fā)表于 07-07 13:56 ?641次閱讀
    測(cè)縫計(jì)測(cè)量數(shù)據(jù)的<b class='flag-5'>準(zhǔn)確性</b>和校準(zhǔn)方法解析

    必知!影響手機(jī)氣密檢測(cè)準(zhǔn)確性的重要因素

    移動(dòng)設(shè)備防水防塵技術(shù)升級(jí),手機(jī)氣密檢測(cè)成保障產(chǎn)品可靠的關(guān)鍵。但檢測(cè)準(zhǔn)確性受設(shè)備精度、環(huán)境穩(wěn)定性、操作規(guī)范性及手機(jī)結(jié)構(gòu)設(shè)計(jì)局限等因素干擾,影響測(cè)試結(jié)果、產(chǎn)品良品率和用戶體驗(yàn)。影響手機(jī)氣密
    的頭像 發(fā)表于 07-04 14:26 ?866次閱讀
    必知!影響手機(jī)氣密<b class='flag-5'>性</b>檢測(cè)<b class='flag-5'>準(zhǔn)確性</b>的重要因素

    模型推理顯存和計(jì)算量估計(jì)方法研究

    上進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,所提出的估計(jì)方法具有較高的準(zhǔn)確性和實(shí)用。 五、結(jié)論 本文針對(duì)大模型推理的顯存和計(jì)算量估計(jì)問題,提出了基于模型結(jié)構(gòu)和硬件加速的估計(jì)方法。實(shí)驗(yàn)結(jié)果表明,這些方
    發(fā)表于 07-03 19:43

    如何使用POT準(zhǔn)確性檢查器?

    :95:0.00% 分辨率視覺對(duì)象等級(jí)挑戰(zhàn) (VOC) 數(shù)據(jù)集未經(jīng)英特爾驗(yàn)證。如 Yolo-v4-tf 文檔 中所提到,英特爾已使用上下文中常見的對(duì)象 (COCO) 數(shù)據(jù)集驗(yàn)證了準(zhǔn)確性。通過
    發(fā)表于 03-06 08:04