chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

無監(jiān)督學(xué)習(xí)的數(shù)據(jù)集變換和聚類

汽車玩家 ? 來源:CSDN ? 作者:zzc_zhuyu ? 2020-05-04 18:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1、類型

主要有兩種類型:數(shù)據(jù)集變換和聚類。

無監(jiān)督變換:

降維:接受數(shù)據(jù)的高維表示,找到新的表示方法,以用較少的特征概括重要特性。

找到“構(gòu)成”數(shù)據(jù)的各個組成部分。例如,文本的主題提取。

聚類:

將數(shù)據(jù)劃分成不同的組,每組包含相似的物項

2、降維

1. 主成分分析(PCA)

一種旋轉(zhuǎn)數(shù)據(jù)集的方法,旋轉(zhuǎn)后的特征在統(tǒng)計上不相關(guān)。旋轉(zhuǎn)后,通常根據(jù)新特征對數(shù)據(jù)集的重要性來選擇它的一個子集。

主成分

方差最大的方向為“成分1”,這是包含包含最多信息的方向。之后找到與“成分1”正交的包含信息最多的方向,得到“成分2”……利用這一過程找到的方向成為主成分。通常,主成分的個數(shù)與原始特征相同。

在PCA找到的額旋轉(zhuǎn)表示中,坐標(biāo)軸之間 不相關(guān)。

應(yīng)用

高維數(shù)據(jù)集可視化

特征提?。赫业揭环N數(shù)據(jù)表示,比給定的原始表示更適合于分析。

對PCA模型的另一種理解:僅適用一些成分對原始數(shù)據(jù)進行重建。

2. 非負(fù)矩陣分解(NMF)

在NMF中,目標(biāo)是分量和系數(shù)均為非負(fù)。只能應(yīng)用于每個特征都是非負(fù)的數(shù)據(jù),因為非負(fù)分量的非負(fù)求和不可能得到負(fù)值。

與PCA不同,減少分量個數(shù)不僅會刪除一些方向,而且會創(chuàng)建一組完全不同的分量。

NMF的分量沒有按任何特定方法排序,所有分量的地位平等。

NMF使用了隨機初始化,根據(jù)隨機種子的不同可能會產(chǎn)生不同的結(jié)果。

3. t-SNE與流形學(xué)習(xí)

流形學(xué)習(xí)算法 :主要用于可視化,允許進行更復(fù)雜的映射。只能變換用于訓(xùn)練的數(shù)據(jù)。

t-SNE:找到數(shù)據(jù)的一個二維表示,盡可能保持?jǐn)?shù)據(jù)點之間的距離。試圖保存那些點比較靠近的信息。

3、聚類

聚類:將數(shù)據(jù)集劃分成組的任務(wù),這些組叫做簇。

1. K均值聚類

原理

試圖找到代表數(shù)據(jù)特定區(qū)域的簇中心。

算法過程

① 將每個數(shù)據(jù)點分配給最近的簇中心

② 將每個簇中心設(shè)置為所分配的所有數(shù)據(jù)點的平均值,如果簇的分配不再變化,結(jié)束;反之,執(zhí)行步驟1

注:聚類算法與分類算法類似,但不存在真實的標(biāo)簽,標(biāo)簽本身沒有先驗意義。

注意

每個簇僅由其中心決定,這意味著每個簇都是凸型的,因此,只能找到相對簡單的形狀。

k均值假設(shè)所有簇在某種程度上有相同的直徑,它總是將簇之間的邊界剛好畫在簇中心的中間位置

k均值假設(shè)所有方向?qū)γ總€簇同等重要

特點

優(yōu)點:

容易理解和實現(xiàn)

運行速度相對較快

擴展到大型數(shù)據(jù)集比較容易

缺點:

依賴于隨機初始化

對簇形狀的假設(shè)的約束性較強

要求制定所要尋找到簇的個數(shù)

2. 凝聚聚類

算法首先聲明每個點是自己的簇,然后合并兩個最相似的簇,直到滿足某種停止準(zhǔn)則為止。

連接準(zhǔn)則:規(guī)定如何度量“最相似的簇”。

① ward型:兩個簇合并后,使得所有簇中方差增加最小

② average型:平均距離最小的兩個簇合并

③ complete型:簇中點之間最大距離最小的兩個簇合并

注:凝聚算法不能對新數(shù)據(jù)點做出預(yù)測

凝聚聚類生成了所謂的層次聚類

3. DBSCAN (具有噪聲的基于密度的空間聚類應(yīng)用)

原理

識別特征空間的“擁擠”區(qū)域中的點,這些區(qū)域成為密集區(qū)域。簇形成數(shù)據(jù)的密集區(qū)域,并由相對較空的區(qū)域分隔開。在密集區(qū)域中的點成為核心樣本,指定參數(shù)eps和min_samples。如果在一個點eps的距離內(nèi)至少有min_samples個數(shù)據(jù)點,則為核心樣本。

算法過程

① 任意選取一個點,檢查是否是核心樣本。

② 若不是,標(biāo)記為噪聲。反之,標(biāo)記為核心樣本,并分配一個新的簇標(biāo)簽。然后檢查鄰居,若未被分配,分配簇標(biāo)簽;如果是核心樣本,依次訪問鄰居。

③ 選取另一個尚未被訪問過的點,重復(fù)以上過程。

最后得到三種點:核心點、邊界點、噪聲。

特點

優(yōu)點:

不需先驗設(shè)置簇的個數(shù)

可以劃分具有復(fù)雜形狀的簇

可以找出不屬于任何簇的點

缺點:

不允許對新的測試數(shù)據(jù)進行預(yù)測

聚類評估

1. 真實值評估

調(diào)整rand指數(shù)(ARI),歸一化互信息(NMI)

二者都給出了定量的度量,最佳值為1,0表示不相關(guān)的聚類。

2. 沒有真實值

輪廓系數(shù) 計算一個簇的緊致度,值越大越好,最高分?jǐn)?shù)為1。雖然緊致的簇很好,但不允許復(fù)雜的形狀。

聚類小結(jié)

k均值

可以用簇的平均值來表示簇。

可被看做是一種分解方法,。每個數(shù)據(jù)點都由其簇中心表示

DBSCAN

可以檢測噪聲點

可以自動判斷簇的數(shù)量

允許簇有復(fù)雜的形狀

有時會生成大小差別很大的簇,可能是優(yōu)點可能是缺點

凝聚聚類

可以提供數(shù)據(jù)的可能劃分的整個層次結(jié)構(gòu)

可以通過樹狀圖查看

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4781

    瀏覽量

    97966
  • 無監(jiān)督學(xué)習(xí)

    關(guān)注

    1

    文章

    17

    瀏覽量

    2891
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    強化學(xué)習(xí)會讓自動駕駛模型學(xué)習(xí)更快嗎?

    是一種讓機器通過“試錯”學(xué)會決策的辦法。與監(jiān)督學(xué)習(xí)不同,監(jiān)督學(xué)習(xí)是有人提供示范答案,讓模型去模仿;而強化學(xué)習(xí)不會把每一步的“正確答案”都告訴你,而是把環(huán)境、動作和結(jié)果連起來,讓機器自己探索哪個行為長期看起來更有利
    的頭像 發(fā)表于 01-31 09:34 ?599次閱讀
    強化<b class='flag-5'>學(xué)習(xí)</b>會讓自動駕駛模型<b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    看懂C語言程序中的內(nèi)和耦合

    處理元素的輸出是后一個處理元素的輸入。對于這樣的函數(shù),如果不致于產(chǎn)生高耦合的話,可以分開兩個函數(shù)實現(xiàn)。 有的函數(shù),其中的不同處理功能僅僅是由于都訪問某一個公用數(shù)據(jù)而發(fā)生關(guān)聯(lián),這稱為通信內(nèi)和信息內(nèi)
    發(fā)表于 12-08 06:37

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學(xué)習(xí)實戰(zhàn)課(11大系列課程,共5000+分鐘)

    強化 監(jiān)督學(xué)習(xí)應(yīng)用:無需NG樣本的缺陷檢測方案,解決工業(yè)數(shù)據(jù)標(biāo)注難題 多模態(tài)融合技術(shù):PaddleOCR+YOLOv8聯(lián)動方案,實現(xiàn)\"文字識別+缺陷定位\"一體化 團購課程大綱
    發(fā)表于 12-04 09:28

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學(xué)習(xí)實戰(zhàn)課程(11大系列課程,共5000+分鐘)

    強化 監(jiān)督學(xué)習(xí)應(yīng)用:無需NG樣本的缺陷檢測方案,解決工業(yè)數(shù)據(jù)標(biāo)注難題 多模態(tài)融合技術(shù):PaddleOCR+YOLOv8聯(lián)動方案,實現(xiàn)\"文字識別+缺陷定位\"一體化 團購課程大綱
    發(fā)表于 12-03 13:50

    自動駕駛中常提的“強化學(xué)習(xí)”是個啥?

    下,就是一個智能體在環(huán)境里行動,它能觀察到環(huán)境的一些信息,并做出一個動作,然后環(huán)境會給出一個反饋(獎勵或懲罰),智能體的目標(biāo)是把長期得到的獎勵累積到最大。和監(jiān)督學(xué)習(xí)不同,強化學(xué)習(xí)沒有一一對應(yīng)的“正確答案”給它看,而是靠與環(huán)境交互、自我探索來發(fā)現(xiàn)
    的頭像 發(fā)表于 10-23 09:00 ?630次閱讀
    自動駕駛中常提的“強化<b class='flag-5'>學(xué)習(xí)</b>”是個啥?

    芯INJOINIC一級代理商——泉鑫科技

    深圳市泉鑫科技有限公司作為英芯(INJOINIC)中國區(qū)授權(quán)一級代理商,始終秉持“全力服務(wù)客戶,為客戶創(chuàng)造終生價值”的理念,致力于為客戶提供優(yōu)質(zhì)高效的電子元器件供應(yīng)鏈服務(wù)與技術(shù)支持。英芯作為
    的頭像 發(fā)表于 09-02 14:55 ?1149次閱讀
    英<b class='flag-5'>集</b>芯INJOINIC一級代理商——<b class='flag-5'>聚</b>泉鑫科技

    任正非說 AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進來呢?

    的基本理論。了解監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)的基本原理。例如,在監(jiān)督學(xué)習(xí)中,理解如何通過標(biāo)注數(shù)據(jù)
    發(fā)表于 07-08 17:44

    張飛FOC磁場定向控制有感、感電機驅(qū)動視頻課程及STM32開發(fā)套件(共257)

    8)FOC有感感控制原理及框圖介紹 9)SVPWM理論、推導(dǎo)、調(diào)試 10)標(biāo)幺化、定點化、Q格式介紹 11)三電阻、雙電阻、單電阻采樣思路分析 12)坐標(biāo)變換(Clarke變換、Park
    發(fā)表于 07-02 15:59

    機器學(xué)習(xí)異常檢測實戰(zhàn):用Isolation Forest快速構(gòu)建標(biāo)簽異常檢測系統(tǒng)

    本文轉(zhuǎn)自:DeepHubIMBA監(jiān)督異常檢測作為機器學(xué)習(xí)領(lǐng)域的重要分支,專門用于在缺乏標(biāo)記數(shù)據(jù)的環(huán)境中識別異常事件。本文深入探討異常檢測技術(shù)的理論基礎(chǔ)與實踐應(yīng)用,通過Isolatio
    的頭像 發(fā)表于 06-24 11:40 ?1390次閱讀
    機器<b class='flag-5'>學(xué)習(xí)</b>異常檢測實戰(zhàn):用Isolation Forest快速構(gòu)建<b class='flag-5'>無</b>標(biāo)簽異常檢測系統(tǒng)

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報錯網(wǎng)絡(luò)錯誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    飛光電總部大廈正式啟用

    飛光電大廈位于平湖金融與現(xiàn)代服務(wù)業(yè)基地核心商圈,占地面積4,186平方米,總建筑面積40,519平方米,樓高99米,是面向未來的企業(yè)總部,綜合辦公、總部運營、技術(shù)研發(fā)、商業(yè)配套等功能于一身
    的頭像 發(fā)表于 06-06 15:26 ?990次閱讀

    使用MATLAB進行監(jiān)督學(xué)習(xí)

    監(jiān)督學(xué)習(xí)是一種根據(jù)未標(biāo)注數(shù)據(jù)進行推斷的機器學(xué)習(xí)方法。監(jiān)督學(xué)習(xí)旨在識別
    的頭像 發(fā)表于 05-16 14:48 ?1410次閱讀
    使用MATLAB進行<b class='flag-5'>無</b><b class='flag-5'>監(jiān)督學(xué)習(xí)</b>

    橋PFC變換器綜述

    器拓?fù)涞陌l(fā)展歷程進行了全面綜述,并將橋 PFC 變換器拓?fù)浜铣煞桨阜譃槿?b class='flag-5'>類,分別進行了詳細(xì)介紹。最后,給出了無橋變換器拓?fù)涞陌l(fā)展方向。 關(guān)鍵詞:
    發(fā)表于 03-13 13:50

    請問NanoEdge AI數(shù)據(jù)該如何構(gòu)建?

    我想用NanoEdge來識別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數(shù)據(jù)的問題,請問我該怎么構(gòu)建數(shù)據(jù)?或者生成模型失敗還會有哪些原因?
    發(fā)表于 03-10 08:20