chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

隨機(jī)森林的概念、工作原理及用例

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-08-05 10:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨機(jī)森林是一種監(jiān)督式算法,使用由眾多決策樹(shù)組成的一種集成學(xué)習(xí)方法,輸出是對(duì)問(wèn)題最佳答案的共識(shí)。隨機(jī)森林可用于分類(lèi)或回歸。

什么是隨機(jī)森林?

隨機(jī)森林是用于分類(lèi)和回歸的一種主流集成學(xué)習(xí)方法。

集成學(xué)習(xí)方法結(jié)合了多種機(jī)器學(xué)習(xí) (ML) 算法,以獲得更好的模型 – 應(yīng)用于數(shù)據(jù)科學(xué)的群體智慧。此類(lèi)學(xué)習(xí)方法基于這樣一種概念:一群對(duì)問(wèn)題領(lǐng)域知之有限的人集思廣益,可以獲得比一個(gè)知識(shí)豐富的人更好的解決方案。

隨機(jī)森林是一組決策樹(shù),是幾乎人人都熟悉的解決問(wèn)題的比喻。決策樹(shù)通過(guò)針對(duì)數(shù)據(jù)集元素,詢(xún)問(wèn)一系列回答是否的問(wèn)題來(lái)得出答案。在下面的示例中,為了預(yù)測(cè)一個(gè)人的收入,決策會(huì)考慮變量(特征),例如此人是否有工作(是或否)以及此人是否有房子。在算法環(huán)境中,機(jī)器會(huì)不斷搜索特征,以允許將一組中的觀察結(jié)果按如下方式進(jìn)行分割,即結(jié)果組之間盡可能不同,而每個(gè)不同子組的成員之間盡可能相似。

ae1d5a88-13f4-11ed-ba43-dac502259ad0.png

隨機(jī)森林使用名為“bagging”的技術(shù),通過(guò)數(shù)據(jù)集和特征的隨機(jī)自助抽樣樣本并行構(gòu)建完整的決策樹(shù)。雖然決策樹(shù)基于一組固定的特征,而且經(jīng)常過(guò)擬合,但隨機(jī)性對(duì)森林的成功至關(guān)重要。

ae35625e-13f4-11ed-ba43-dac502259ad0.png

隨機(jī)性可確保單個(gè)樹(shù)之間的相關(guān)性較低,從而減少偏差風(fēng)險(xiǎn)。大量樹(shù)的存在也減少了過(guò)擬合問(wèn)題,如果模型在訓(xùn)練數(shù)據(jù)中加入過(guò)多“噪聲”并因此做出糟糕決策,這種問(wèn)題就會(huì)出現(xiàn)。

使用隨機(jī)森林模型,隨著模型中不相關(guān)樹(shù)的數(shù)量增加,做出正確預(yù)測(cè)的可能性也會(huì)增加。結(jié)果的質(zhì)量更高,因?yàn)樗鼈兎从沉舜蠖鄶?shù)樹(shù)做出的決策。此投票過(guò)程通過(guò)限制誤差來(lái)保護(hù)每個(gè)樹(shù)不互相傷害。即使有些樹(shù)錯(cuò)誤,也會(huì)有一些樹(shù)正確,因此這組樹(shù)集體朝正確的方向前行。雖然隨機(jī)森林模型在考慮許多特征時(shí)可能會(huì)運(yùn)行緩慢,但即使是使用有限數(shù)量特征的小模型也會(huì)產(chǎn)生非常好的結(jié)果。

隨機(jī)森林的工作原理是什么?

隨機(jī)森林中的每棵樹(shù)在稱(chēng)為自助聚集 (bagging) 的過(guò)程中隨機(jī)對(duì)訓(xùn)練數(shù)據(jù)子集進(jìn)行抽樣。該模型適合這些較小的數(shù)據(jù)集,并匯總預(yù)測(cè)結(jié)果。通過(guò)有放回抽樣,可以重復(fù)使用同一數(shù)據(jù)的幾個(gè)實(shí)例,結(jié)果就是,這些樹(shù)不僅基于不同的數(shù)據(jù)集進(jìn)行訓(xùn)練,而且還使用不同的特性做出決策。

ae53b4e8-13f4-11ed-ba43-dac502259ad0.png

圖像來(lái)源:KDNuggets

用例

分類(lèi)示例包括:

欺詐檢測(cè)

垃圾郵件檢測(cè)

文本情感分析

預(yù)測(cè)患者風(fēng)險(xiǎn)、敗血癥或癌癥

回歸示例包括:

預(yù)測(cè)欺詐數(shù)量

預(yù)測(cè)銷(xiāo)售額

為何選擇隨機(jī)森林?

隨機(jī)森林模型有五個(gè)主要優(yōu)點(diǎn):

非常適合回歸和分類(lèi)問(wèn)題?;貧w中的輸出變量是一個(gè)數(shù)字序列,例如某個(gè)街區(qū)的房?jī)r(jià)。分類(lèi)問(wèn)題的輸出變量通常是一個(gè)單一答案,例如房屋的售價(jià)是否高于或低于要價(jià)。

可以處理缺失值并保持高準(zhǔn)確性,即使由于 bagging 和有放回抽樣而缺失大量數(shù)據(jù)時(shí)也是如此。

算法由于輸出的是“多數(shù)規(guī)則”,使得模型幾乎不可能過(guò)擬合。

該模型可以處理包含數(shù)千個(gè)輸入變量的龐大數(shù)據(jù)集,因此成為降維的不錯(cuò)工具。

其算法可用于從訓(xùn)練數(shù)據(jù)集中識(shí)別非常重要的特征。

其也有一些缺點(diǎn):

隨機(jī)森林優(yōu)于決策樹(shù),但其準(zhǔn)確性低于 XGBoost 等梯度提升樹(shù)集成。

隨機(jī)森林包含大量樹(shù),因此速度比 XGBoost 慢。

梯度提升決策樹(shù)

梯度提升決策樹(shù) (GBDT) 是一種決策樹(shù)集成學(xué)習(xí)算法,類(lèi)似于用于分類(lèi)和回歸的隨機(jī)森林。隨機(jī)森林和 GBDT 都構(gòu)建了由多個(gè)決策樹(shù)組成的模型。兩者的區(qū)別在于重建和組合的方式。

GBDT 使用一種稱(chēng)為 boosting 的技術(shù),以迭代方式訓(xùn)練一組淺層決策樹(shù),每次迭代都使用上一個(gè)模型的殘差擬合下一個(gè)模型。最終得到的預(yù)測(cè)結(jié)果是所有樹(shù)預(yù)測(cè)結(jié)果的加權(quán)總和。隨機(jī)森林 bagging 可大幅減少差異和過(guò)擬合,而 GBDT boosting 則可減少偏差和欠擬合。

XGBoost(極端梯度提升)是 GBDT 的領(lǐng)先、可擴(kuò)展的分布式變體。使用 XGBoost 時(shí),樹(shù)并行構(gòu)建,而非順序構(gòu)建。GBoost 遵循按層生長(zhǎng)策略,掃描梯度值并使用這些部分和來(lái)評(píng)估訓(xùn)練集中每個(gè)可分割點(diǎn)的分割質(zhì)量。

XGBoost 因其廣泛的用例、可移植性、多樣化的語(yǔ)言支持以及云集成而廣受歡迎。

與 XGBoost 相比,隨機(jī)森林模型的準(zhǔn)確性可能會(huì)因兩個(gè)不同的誤差來(lái)源(偏差和方差)而下降:

梯度提升模型通過(guò)以低學(xué)習(xí)率進(jìn)行多輪提升來(lái)消除偏差和方差。

梯度提升模型超參數(shù)也有助于消除方差。

隨機(jī)森林模型使用樹(shù)深度和樹(shù)的數(shù)量消除偏差和方差。

隨機(jī)森林樹(shù)可能需要比梯度提升樹(shù)更深入。

更多數(shù)據(jù)可減少偏差和方差。

NVIDIA GPU 加速的

隨機(jī)森林、XGBOOST 和端到端數(shù)據(jù)科學(xué)

在架構(gòu)方面,CPU 僅由幾個(gè)具有大緩存內(nèi)存的核心組成,一次只可以處理幾個(gè)軟件線程。相比之下,GPU 由數(shù)百個(gè)核心組成,可以同時(shí)處理數(shù)千個(gè)線程。

ae784146-13f4-11ed-ba43-dac502259ad0.jpg

基于 CUDA-X AI 創(chuàng)建的 NVIDIA RAPIDS開(kāi)源軟件庫(kù)套件使您完全能夠在 GPU 上執(zhí)行端到端數(shù)據(jù)科學(xué)和分析流程。此套件依靠 NVIDIA CUDA 基元進(jìn)行低級(jí)別計(jì)算優(yōu)化,但通過(guò)用戶(hù)友好型 Python 接口實(shí)現(xiàn)了 GPU 并行化和高帶寬顯存速度。

ae947f64-13f4-11ed-ba43-dac502259ad0.png

借助 RAPIDS GPU DataFrame,數(shù)據(jù)可以通過(guò)一個(gè)類(lèi)似 Pandas 的接口加載到 GPU 上,然后用于各種連接的機(jī)器學(xué)習(xí)和圖形分析算法,而無(wú)需離開(kāi) GPU。這種級(jí)別的互操作性可通過(guò) Apache Arrow 等庫(kù)實(shí)現(xiàn),并且可加速端到端流程(從數(shù)據(jù)準(zhǔn)備到機(jī)器學(xué)習(xí),再到深度學(xué)習(xí))。

RAPIDS 的機(jī)器學(xué)習(xí)算法和數(shù)學(xué)基元遵循熟悉的類(lèi)似于 scikit-learn 的 API。單塊 GPU 和大型數(shù)據(jù)中心部署均支持 XGBoost、隨機(jī)森林等主流工具。針對(duì)大型數(shù)據(jù)集,相較于同等功效的 CPU,這些基于 GPU 的實(shí)施方案能夠以 10 到 50 倍的速度更快地完成任務(wù)。

NVIDIA RAPIDS 團(tuán)隊(duì)與 DMLC XGBoost 組織建立了緊密的合作關(guān)系,而且 GPU 加速 XGBoost 現(xiàn)已包括無(wú)縫嵌入式 GPU 加速,可顯著加快模型訓(xùn)練速度并提高準(zhǔn)確性。對(duì)在配備 NVIDIA P100 加速器和 32 個(gè)英特爾至強(qiáng) E5-2698 CPU 核心的系統(tǒng)上運(yùn)行的 XGBoost 腳本進(jìn)行的測(cè)試表明,相較于在輸出質(zhì)量相同的非 GPU 系統(tǒng)上運(yùn)行相同的測(cè)試,速度提升了 4 倍。這一點(diǎn)尤為重要,因?yàn)閿?shù)據(jù)科學(xué)家通常會(huì)多次運(yùn)行 XGBoost,以便調(diào)整參數(shù)并找到出色的準(zhǔn)確性。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5682

    瀏覽量

    110087
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4800

    瀏覽量

    98487
  • 隨機(jī)森林
    +關(guān)注

    關(guān)注

    1

    文章

    22

    瀏覽量

    4448

原文標(biāo)題:NVIDIA 大講堂 | 什么是 隨機(jī)森林?

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    這個(gè)電路干啥的呢?它的工作原理是怎么樣?

    很多工程師認(rèn)為圈起來(lái)的這個(gè)電路不能工作,我剛開(kāi)始看到這個(gè)電路也是這么認(rèn)為的!這個(gè)圈起來(lái)的三極管(PNP)電路到底能不能工作呢,怎么樣的工作原理呢?歡迎工程師們?cè)谠u(píng)論區(qū)暢所欲言。 APA320-160W+160W.
    發(fā)表于 04-15 11:03

    串行mram磁性隨機(jī)存儲(chǔ)器的工作原理與存儲(chǔ)機(jī)制

    在存儲(chǔ)器技術(shù)不斷演進(jìn)的今天,MRAM磁性隨機(jī)存儲(chǔ)器憑借其獨(dú)特的非易失性、高速讀寫(xiě)與高耐久性,正成為越來(lái)越多高端應(yīng)用場(chǎng)景的理想選擇。尤其是串行MRAM磁性隨機(jī)存儲(chǔ)器,通過(guò)精簡(jiǎn)的接口設(shè)計(jì)與靈活的集成方式,進(jìn)一步拓展了MRAM在嵌入式系統(tǒng)、工業(yè)控制和汽車(chē)電子等領(lǐng)域的適用性。
    的頭像 發(fā)表于 03-30 16:27 ?194次閱讀
    串行mram磁性<b class='flag-5'>隨機(jī)</b>存儲(chǔ)器的<b class='flag-5'>工作原理</b>與存儲(chǔ)機(jī)制

    無(wú)線充電器的工作原理核心

    無(wú)線充電器的工作原理核心
    的頭像 發(fā)表于 12-06 10:19 ?1827次閱讀
    無(wú)線充電器的<b class='flag-5'>工作原理</b>核心

    騰柱無(wú)橋PFC電路的工作原理和拓?fù)浣Y(jié)構(gòu)

    以單極性SPWM調(diào)制方式為,說(shuō)明圖騰柱PFC的工作原理。此處僅以正向AC-DC說(shuō)明。后續(xù)會(huì)專(zhuān)門(mén)介紹DC-AC的功能介紹。
    的頭像 發(fā)表于 11-26 14:30 ?4228次閱讀
    騰柱無(wú)橋PFC電路的<b class='flag-5'>工作原理</b>和拓?fù)浣Y(jié)構(gòu)

    永銘超級(jí)電容SLM系列賦能森林防火監(jiān)控系統(tǒng),凸顯關(guān)鍵電容優(yōu)勢(shì)

    DESIGNER'SDREAM森林防火監(jiān)控系統(tǒng)的市場(chǎng)前景01隨著氣候變化導(dǎo)致全球范圍內(nèi)極端天氣增多,各國(guó)政府和相關(guān)部門(mén)對(duì)森林防火工作的重視程度不斷提升,對(duì)高效、智能化的森林
    的頭像 發(fā)表于 09-01 10:08 ?680次閱讀
    永銘超級(jí)電容SLM系列賦能<b class='flag-5'>森林</b>防火監(jiān)控系統(tǒng),凸顯關(guān)鍵電容優(yōu)勢(shì)

    廣州唯創(chuàng)電子語(yǔ)音芯片的工作原理與應(yīng)用解析

    、車(chē)載導(dǎo)航、醫(yī)療器械等領(lǐng)域提供了高效的語(yǔ)音解決方案。本文將以唯創(chuàng)電子語(yǔ)音芯片為,深入解析其工作原理及技術(shù)特點(diǎn)。一、語(yǔ)音芯片的核心工作原理語(yǔ)音芯片的工作流程可分為
    的頭像 發(fā)表于 08-28 08:33 ?811次閱讀
    廣州唯創(chuàng)電子語(yǔ)音芯片的<b class='flag-5'>工作原理</b>與應(yīng)用解析

    隨機(jī)數(shù)和偽隨機(jī)數(shù)的區(qū)別

    隨機(jī)數(shù)在當(dāng)前程序運(yùn)行環(huán)境中是一種常用參數(shù),目前主要分為兩種,偽隨機(jī)數(shù)和真隨機(jī)數(shù),本期我們就來(lái)講一下二者的區(qū)別。
    的頭像 發(fā)表于 08-27 17:46 ?2857次閱讀

    解析基帶和射頻的工作原理

    在現(xiàn)代通信技術(shù)中,基帶和射頻是兩個(gè)核心概念,它們共同構(gòu)成了無(wú)線通信的基礎(chǔ)。盡管這兩個(gè)術(shù)語(yǔ)頻繁出現(xiàn)在技術(shù)文檔和行業(yè)討論中,但其具體功能和技術(shù)細(xì)節(jié)卻常常被誤解。本文將以移動(dòng)通信為,深入解析基帶和射頻的工作原理及其在通信鏈路中的作用
    的頭像 發(fā)表于 08-06 09:28 ?2957次閱讀
    解析基帶和射頻的<b class='flag-5'>工作原理</b>

    藍(lán)牙隨機(jī)化RPA更新的重要性和工作原理

    藍(lán)牙?隨機(jī)可解析私有地址(Bluetooth? Randomized RPA)更新功能已推出,該更新通過(guò)優(yōu)化可解析私有地址的管理,提高了低功耗藍(lán)牙設(shè)備的隱私性和能效。本文將介紹藍(lán)牙?隨機(jī)化RPA更新的重要性、解釋其工作原理,并為
    的頭像 發(fā)表于 07-10 09:36 ?1107次閱讀
    藍(lán)牙<b class='flag-5'>隨機(jī)</b>化RPA更新的重要性和<b class='flag-5'>工作原理</b>

    語(yǔ)音控制模塊工作原理

    ,才能夠發(fā)出正確的指令。 語(yǔ)音芯片控制模塊是實(shí)現(xiàn) “語(yǔ)音指令 - 設(shè)備響應(yīng)” 的核心組件,其工作原理可拆解為信號(hào)采集、處理、識(shí)別及指令執(zhí)行的完整鏈路,下面將以WTK69000為給大家分享一下整個(gè)流程的工作原理。 一、語(yǔ)音信號(hào)采
    的頭像 發(fā)表于 06-17 11:49 ?1649次閱讀
    語(yǔ)音控制模塊<b class='flag-5'>工作原理</b>

    管道浮力平衡壓袋(配重壓袋)工作原理

    管道浮力平衡壓袋(配重壓袋)工作原理
    發(fā)表于 06-12 15:09 ?0次下載

    FLASH的工作原理與應(yīng)用

    14FLASHFLASH的工作原理與應(yīng)用OWEIS1什么是FLASH?Flash閃存是一種非易失性半導(dǎo)體存儲(chǔ)器,它結(jié)合了ROM(只讀存儲(chǔ)器)和RAM(隨機(jī)訪問(wèn)存儲(chǔ)器)的優(yōu)點(diǎn),具有電子可擦除和可編程
    的頭像 發(fā)表于 05-27 13:10 ?2357次閱讀
    FLASH的<b class='flag-5'>工作原理</b>與應(yīng)用

    GPIO配置的工作原理是什么?

    我使用 EZ-USB 配置實(shí)用程序,我想知道是否有人知道 GPIO 配置的工作原理。 例如,GPIO0 可以用作傳感器復(fù)位,我知道這個(gè) GPIO0 用于重置傳感器,但我不明白的是選項(xiàng)用戶(hù) GPIO 例如GPIO 1可以是User GPIO0,這是什么意思呢?
    發(fā)表于 05-19 06:56

    水質(zhì)常規(guī)五參數(shù)探頭工作原理

    在水環(huán)境監(jiān)測(cè)領(lǐng)域,水質(zhì)常規(guī)五參數(shù)(pH、溶解氧、電導(dǎo)率、濁度、溫度)探頭對(duì)于準(zhǔn)確把握水質(zhì)狀況意義重大。本文以DX-W100-1在線多參數(shù)水質(zhì)傳感器為,深入剖析這些參數(shù)探頭的工作原理。一、pH探頭
    的頭像 發(fā)表于 05-13 17:07 ?1595次閱讀
    水質(zhì)常規(guī)五參數(shù)探頭<b class='flag-5'>工作原理</b>

    電動(dòng)調(diào)壓器的工作原理

    電壓調(diào)壓器是一種用于控制電路中電壓的裝置,其工作原理因類(lèi)型而異,以下是幾種常見(jiàn)電壓調(diào)壓器的工作原理
    的頭像 發(fā)表于 05-12 13:46 ?1594次閱讀
    電動(dòng)調(diào)壓器的<b class='flag-5'>工作原理</b>