chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一文帶你快速讀懂支持向量機(jī) SVM 算法

h1654155999.2342 ? 來源:博客園 ? 作者: JerryLead ? 2021-08-26 15:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

簡介

支持向量機(jī)基本上是最好的有監(jiān)督學(xué)習(xí)算法了。最開始接觸SVM是去年暑假的時(shí)候,老師要求交《統(tǒng)計(jì)學(xué)習(xí)理論》的報(bào)告,那時(shí)去網(wǎng)上下了一份入門教程,里面講的很通俗,當(dāng)時(shí)只是大致了解了一些相關(guān)概念。

這次斯坦福提供的學(xué)習(xí)材料,讓我重新學(xué)習(xí)了一些SVM知識(shí)。我看很多正統(tǒng)的講法都是從VC 維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理出發(fā),然后引出SVM什么的,還有些資料上來就講分類超平面什么的。

這份材料從前幾節(jié)講的logistic回歸出發(fā),引出了SVM,既揭示了模型間的聯(lián)系,也讓人覺得過渡更自然。

重新審視logistic回歸

Logistic回歸目的是從特征學(xué)習(xí)出一個(gè)0/1分類模型,而這個(gè)模型是將特性的線性組合作為自變量,由于自變量的取值范圍是負(fù)無窮到正無窮。

因此,使用logistic函數(shù)(或稱作sigmoid函數(shù))將自變量映射到(0,1)上,映射后的值被認(rèn)為是屬于y=1的概率。

形式化表示就是

假設(shè)函數(shù)

aa5ecf14-f846-11eb-9bcf-12bb97331649.png

其中x是n維特征向量,函數(shù)g就是logistic函數(shù)。

aa77a2dc-f846-11eb-9bcf-12bb97331649.png的圖像是

aa93046e-f846-11eb-9bcf-12bb97331649.png

可以看到,將無窮映射到了(0,1)。

而假設(shè)函數(shù)就是特征屬于y=1的概率。

aabd24d8-f846-11eb-9bcf-12bb97331649.png

當(dāng)我們要判別一個(gè)新來的特征屬于哪個(gè)類時(shí),只需求aaeb088a-f846-11eb-9bcf-12bb97331649.png,若大于0.5就是y=1的類,反之屬于y=0類。

再審視一下aaeb088a-f846-11eb-9bcf-12bb97331649.png,發(fā)現(xiàn)aaeb088a-f846-11eb-9bcf-12bb97331649.png只和ab32d732-f846-11eb-9bcf-12bb97331649.png有關(guān),ab32d732-f846-11eb-9bcf-12bb97331649.png>0,那么ab60cbce-f846-11eb-9bcf-12bb97331649.png,g(z)只不過是用來映射,真實(shí)的類別決定權(quán)還在ab32d732-f846-11eb-9bcf-12bb97331649.png。還有當(dāng)ab869638-f846-11eb-9bcf-12bb97331649.png時(shí),aaeb088a-f846-11eb-9bcf-12bb97331649.png=1,反之aaeb088a-f846-11eb-9bcf-12bb97331649.png=0。

如果我們只從ab32d732-f846-11eb-9bcf-12bb97331649.png出發(fā),希望模型達(dá)到的目標(biāo)無非就是讓訓(xùn)練數(shù)據(jù)中y=1的特征ab869638-f846-11eb-9bcf-12bb97331649.png,而是y=0的特征abd0d748-f846-11eb-9bcf-12bb97331649.png

Logistic回歸就是要學(xué)習(xí)得到abef8eea-f846-11eb-9bcf-12bb97331649.png,使得正例的特征遠(yuǎn)大于0,負(fù)例的特征遠(yuǎn)小于0,強(qiáng)調(diào)在全部訓(xùn)練實(shí)例上達(dá)到這個(gè)目標(biāo)。

圖形化表示如下:

ac0c8c5c-f846-11eb-9bcf-12bb97331649.png

中間那條線是ac2780c0-f846-11eb-9bcf-12bb97331649.png,logistic回顧強(qiáng)調(diào)所有點(diǎn)盡可能地遠(yuǎn)離中間那條線。學(xué)習(xí)出的結(jié)果也就中間那條線。

考慮上面3個(gè)點(diǎn)A、B和C。從圖中我們可以確定A是×類別的,然而C我們是不太確定的,B還算能夠確定。這樣我們可以得出結(jié)論,我們更應(yīng)該關(guān)心靠近中間分割線的點(diǎn),讓他們盡可能地遠(yuǎn)離中間線,而不是在所有點(diǎn)上達(dá)到最優(yōu)。

因?yàn)槟菢拥脑?,要使得一部分點(diǎn)靠近中間線來換取另外一部分點(diǎn)更加遠(yuǎn)離中間線。我想這就是支持向量機(jī)的思路和logistic回歸的不同點(diǎn),一個(gè)考慮局部(不關(guān)心已經(jīng)確定遠(yuǎn)離的點(diǎn)),一個(gè)考慮全局(已經(jīng)遠(yuǎn)離的點(diǎn)可能通過調(diào)整中間線使其能夠更加遠(yuǎn)離)。這是我的個(gè)人直觀理解。

形式化表示

我們這次使用的結(jié)果標(biāo)簽是y=-1,y=1,替換在logistic回歸中使用的y=0和y=1。同時(shí)將abef8eea-f846-11eb-9bcf-12bb97331649.png替換成w和b。

以前的ac5a1a08-f846-11eb-9bcf-12bb97331649.png,其中認(rèn)為ac8034f4-f846-11eb-9bcf-12bb97331649.png。現(xiàn)在我們替換aca11cfa-f846-11eb-9bcf-12bb97331649.png為b,后面替換acbfbaf2-f846-11eb-9bcf-12bb97331649.pngacdc3b1e-f846-11eb-9bcf-12bb97331649.png(即ad0adbea-f846-11eb-9bcf-12bb97331649.png)。這樣,我們讓ad2249ce-f846-11eb-9bcf-12bb97331649.png,進(jìn)一步ad4341e2-f846-11eb-9bcf-12bb97331649.png。

也就是說除了y由y=0變?yōu)閥=-1,只是標(biāo)記不同外,與logistic回歸的形式化表示沒區(qū)別。再明確下假設(shè)函數(shù)

ad715730-f846-11eb-9bcf-12bb97331649.png

上一節(jié)提到過我們只需考慮ab32d732-f846-11eb-9bcf-12bb97331649.png的正負(fù)問題,而不用關(guān)心g(z),因此我們這里將g(z)做一個(gè)簡化,將其簡單映射到y(tǒng)=-1和y=1上。映射關(guān)系如下:

ad98c93c-f846-11eb-9bcf-12bb97331649.png

函數(shù)間隔(functional margin)和幾何間隔(geometric margin)

給定一個(gè)訓(xùn)練樣本adb55e08-f846-11eb-9bcf-12bb97331649.png,x是特征,y是結(jié)果標(biāo)簽。i表示第i個(gè)樣本。我們定義函數(shù)間隔如下:

addd8388-f846-11eb-9bcf-12bb97331649.png

可想而知,當(dāng)ae151190-f846-11eb-9bcf-12bb97331649.png時(shí),在我們的g(z)定義中,ae30ac84-f846-11eb-9bcf-12bb97331649.png,ae4fc01a-f846-11eb-9bcf-12bb97331649.png的值實(shí)際上就是ae6752b6-f846-11eb-9bcf-12bb97331649.png。反之亦然。

為了使函數(shù)間隔最大(更大的信心確定該例是正例還是反例),當(dāng)ae151190-f846-11eb-9bcf-12bb97331649.png時(shí),ae8e9f6a-f846-11eb-9bcf-12bb97331649.png應(yīng)該是個(gè)大正數(shù),反之是個(gè)大負(fù)數(shù)。因此函數(shù)間隔代表了我們認(rèn)為特征是正例還是反例的確信度。

繼續(xù)考慮w和b,如果同時(shí)加大w和b,比如在aeac850c-f846-11eb-9bcf-12bb97331649.png前面乘個(gè)系數(shù)比如2,那么所有點(diǎn)的函數(shù)間隔都會(huì)增大二倍,這個(gè)對(duì)求解問題來說不應(yīng)該有影響,因?yàn)槲覀円蠼獾氖?img src="https://file.elecfans.com/web2/M00/12/4D/pYYBAGEnQ1qAfwBTAAAByHc6ZD4972.png" alt="aec9ada8-f846-11eb-9bcf-12bb97331649.png" />,同時(shí)擴(kuò)大w和b對(duì)結(jié)果是無影響的。

這樣,我們?yōu)榱讼拗苭和b,可能需要加入歸一化條件,畢竟求解的目標(biāo)是確定唯一一個(gè)w和b,而不是多組線性相關(guān)的向量。這個(gè)歸一化一會(huì)再考慮。

剛剛我們定義的函數(shù)間隔是針對(duì)某一個(gè)樣本的,現(xiàn)在我們定義全局樣本上的函數(shù)間隔

aee7afba-f846-11eb-9bcf-12bb97331649.png

說白了就是在訓(xùn)練樣本上分類正例和負(fù)例確信度最小那個(gè)函數(shù)間隔。

接下來定義幾何間隔

假設(shè)我們有了B點(diǎn)所在的aec9ada8-f846-11eb-9bcf-12bb97331649.png分割面。任何其他一點(diǎn),比如A到該面的距離以af54e79c-f846-11eb-9bcf-12bb97331649.png表示,假設(shè)B就是A在分割面上的投影。

我們知道向量BA的方向是af7d4476-f846-11eb-9bcf-12bb97331649.png(分割面的梯度),單位向量是afb3cdac-f846-11eb-9bcf-12bb97331649.png。A點(diǎn)是adb55e08-f846-11eb-9bcf-12bb97331649.png,所以B點(diǎn)是x=afdf28bc-f846-11eb-9bcf-12bb97331649.png(利用初中的幾何知識(shí)),帶入aec9ada8-f846-11eb-9bcf-12bb97331649.png得,

進(jìn)一步得到

b02d5640-f846-11eb-9bcf-12bb97331649.png

af54e79c-f846-11eb-9bcf-12bb97331649.png實(shí)際上就是點(diǎn)到平面距離。

再換種更加優(yōu)雅的寫法:

b057aa76-f846-11eb-9bcf-12bb97331649.png

當(dāng)b075fd32-f846-11eb-9bcf-12bb97331649.png時(shí),不就是函數(shù)間隔嗎?是的,前面提到的函數(shù)間隔歸一化結(jié)果就是幾何間隔。

他們?yōu)槭裁磿?huì)一樣呢?因?yàn)楹瘮?shù)間隔是我們定義的,在定義的時(shí)候就有幾何間隔的色彩。同樣,同時(shí)擴(kuò)大w和b,w擴(kuò)大幾倍,b09437e8-f846-11eb-9bcf-12bb97331649.png就擴(kuò)大幾倍,結(jié)果無影響。同樣定義全局的幾何間隔b0b3917e-f846-11eb-9bcf-12bb97331649.png

最優(yōu)間隔分類器(optimal margin classifier)

回想前面我們提到我們的目標(biāo)是尋找一個(gè)超平面,使得離超平面比較近的點(diǎn)能有更大的間距。也就是我們不考慮所有的點(diǎn)都必須遠(yuǎn)離超平面,我們關(guān)心求得的超平面能夠讓所有點(diǎn)中離它最近的點(diǎn)具有最大間距。

形象的說,我們將上面的圖看作是一張紙,我們要找一條折線,按照這條折線折疊后,離折線最近的點(diǎn)的間距比其他折線都要大。形式化表示為:

b0ce205c-f846-11eb-9bcf-12bb97331649.png

這里用b09437e8-f846-11eb-9bcf-12bb97331649.png=1規(guī)約w,使得b0f630a6-f846-11eb-9bcf-12bb97331649.png是幾何間隔。

到此,我們已經(jīng)將模型定義出來了。如果求得了w和b,那么來一個(gè)特征x,我們就能夠分類了,稱為最優(yōu)間隔分類器。接下的問題就是如何求解w和b的問題了。

由于b112b91a-f846-11eb-9bcf-12bb97331649.png不是凸函數(shù),我們想先處理轉(zhuǎn)化一下,考慮幾何間隔和函數(shù)間隔的關(guān)系,b12f9620-f846-11eb-9bcf-12bb97331649.png,我們改寫一下上面的式子:

b149fb8c-f846-11eb-9bcf-12bb97331649.png

這時(shí)候其實(shí)我們求的最大值仍然是幾何間隔,只不過此時(shí)的w不受b112b91a-f846-11eb-9bcf-12bb97331649.png的約束了。然而這個(gè)時(shí)候目標(biāo)函數(shù)仍然不是凸函數(shù),沒法直接代入優(yōu)化軟件里計(jì)算。我們還要改寫。

前面說到同時(shí)擴(kuò)大w和b對(duì)結(jié)果沒有影響,但我們最后要求的仍然是w和b的確定值,不是他們的一組倍數(shù)值,因此,我們需要對(duì)b1b4ebd6-f846-11eb-9bcf-12bb97331649.png做一些限制,以保證我們解是唯一的。

這里為了簡便我們?nèi)?img src="https://file.elecfans.com/web2/M00/12/4D/pYYBAGEnQ1qARWS6AAABLmiOTds980.png" alt="b1d495d0-f846-11eb-9bcf-12bb97331649.png" />。這樣的意義是將全局的函數(shù)間隔定義為1,也即是將離超平面最近的點(diǎn)的距離定義為b1ed6cc2-f846-11eb-9bcf-12bb97331649.png。由于求b1ed6cc2-f846-11eb-9bcf-12bb97331649.png的最大值相當(dāng)于求b21a0b6a-f846-11eb-9bcf-12bb97331649.png的最小值,因此改寫后結(jié)果為:

b23844cc-f846-11eb-9bcf-12bb97331649.png

這下好了,只有線性約束了,而且是個(gè)典型的二次規(guī)劃問題(目標(biāo)函數(shù)是自變量的二次函數(shù))。代入優(yōu)化軟件可解。

到這里發(fā)現(xiàn),這個(gè)講義雖然沒有像其他講義一樣先畫好圖,畫好分類超平面,在圖上標(biāo)示出間隔那么直觀,但每一步推導(dǎo)有理有據(jù),依靠思路的流暢性來推導(dǎo)出目標(biāo)函數(shù)和約束。

—版權(quán)聲明—

僅用于學(xué)術(shù)分享,版權(quán)屬于原作者。

若有侵權(quán),請(qǐng)聯(lián)系 刪除或修改!

轉(zhuǎn)自:JerryLead

http://www.cnblogs.com/jerrylead/archive/2011/03/13/1982639.html

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4800

    瀏覽量

    98503
  • 向量機(jī)
    +關(guān)注

    關(guān)注

    0

    文章

    166

    瀏覽量

    21715
  • SVM
    SVM
    +關(guān)注

    關(guān)注

    0

    文章

    154

    瀏覽量

    33725

原文標(biāo)題:優(yōu)雅的讀懂支持向量機(jī) SVM 算法

文章出處:【微信號(hào):gh_f39db674fbfd,微信公眾號(hào):尖刀視】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    全自動(dòng)劃片機(jī)與半自動(dòng)劃片機(jī)怎么選?讀懂選型關(guān)鍵

    全自動(dòng)劃片機(jī)與半自動(dòng)劃片機(jī)怎么選?讀懂選型關(guān)鍵在半導(dǎo)體封裝、LED制造、光伏電池加工等精密加工領(lǐng)域,劃片
    的頭像 發(fā)表于 03-16 20:54 ?513次閱讀
    全自動(dòng)劃片<b class='flag-5'>機(jī)</b>與半自動(dòng)劃片<b class='flag-5'>機(jī)</b>怎么選?<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>選型關(guān)鍵

    無線通信的“隱形骨架”:讀懂OSI七層模型

    帶你快速理解OSI七層的核心思想——分層。從物理層到應(yīng)用層,每層負(fù)責(zé)什么?為什么說它是網(wǎng)絡(luò)通信的“圣經(jīng)”?如何用它來排查網(wǎng)絡(luò)故障?
    的頭像 發(fā)表于 03-16 09:41 ?394次閱讀
    無線通信的“隱形骨架”:<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>OSI七層模型

    讀懂VCSEL芯片為何與眾不同

    VCSEL芯片是如何誕生的?是德科技帶你走進(jìn)慧芯激光產(chǎn)業(yè)園探究竟!
    的頭像 發(fā)表于 01-09 14:19 ?805次閱讀

    搞清 BLE 藍(lán)牙 UUID

    帶你搞清楚藍(lán)牙 UUID ...... 矜辰所致
    的頭像 發(fā)表于 12-18 11:23 ?4794次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>搞清 BLE 藍(lán)牙 UUID

    帶你讀懂“脈沖輸入輸出模塊”

    在自動(dòng)化生產(chǎn)的世界里,傳感器、執(zhí)行器、控制器每天都在“對(duì)話”??蓡栴}是,它們說的語言千奇百怪——有的輸出電壓信號(hào),有的傳輸電流信號(hào),還有的發(fā)出連串高速脈沖。如果沒有“翻譯官”,系統(tǒng)就亂了套。 而
    的頭像 發(fā)表于 11-24 17:10 ?1178次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b><b class='flag-5'>讀懂</b>“脈沖輸入輸出模塊”

    如何快速讀懂三星貼片電容規(guī)格書?

    快速讀懂三星貼片電容規(guī)格書,可從封裝尺寸、容量、電壓、精度、溫度系數(shù)、其他參數(shù)及命名規(guī)則等方面入手,以下為具體分析: 1、封裝尺寸 :三星貼片電容的封裝尺寸多樣,常見的有0201、0402
    的頭像 發(fā)表于 11-11 16:10 ?785次閱讀

    漢威科技推動(dòng)養(yǎng)老機(jī)構(gòu)智慧消防建設(shè)

    養(yǎng)老市場持續(xù)增長,而養(yǎng)老機(jī)構(gòu)消防建設(shè)水平滯后,矛盾之下如何破局?漢威科技帶你讀懂。
    的頭像 發(fā)表于 11-10 17:23 ?1348次閱讀

    SM4算法實(shí)現(xiàn)分享(算法原理

    對(duì)明文進(jìn)行分組加密變換。SM4加密算法由32次迭代運(yùn)算和次反序變換R組成。 設(shè)輸入明文為(X0,X 1,X 2,X 3),共128位,設(shè)密輸出為(Y0,Y 1,Y 2,Y 3),輪密鑰為rki
    發(fā)表于 10-30 08:10

    使用MATLAB的支持向量機(jī)解決方案

    支持向量機(jī) (SVM) 是種有監(jiān)督機(jī)器學(xué)習(xí)算法,它能找到分離兩個(gè)類的數(shù)據(jù)點(diǎn)的最佳超平面。
    的頭像 發(fā)表于 10-21 15:00 ?750次閱讀
    使用MATLAB的<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機(jī)</b>解決方案

    網(wǎng)絡(luò)路由器關(guān)鍵知識(shí),讀懂

    在互聯(lián)網(wǎng)深度融入日常的今天,網(wǎng)絡(luò)路由器作為不可或缺的樞紐設(shè)備,承擔(dān)著連接世界的關(guān)鍵任務(wù)。但你真正了解它嗎?本文將帶你系統(tǒng)認(rèn)識(shí)路由器的基礎(chǔ)功能、發(fā)展歷程與常見接口,幫助你更好地理解和使用這設(shè)備。
    的頭像 發(fā)表于 09-19 18:10 ?1676次閱讀

    讀懂:CWDM和DWDM的核心差異

    光纖通信里的“兩兄弟”CWDM和DWDM,名字只差個(gè)字母,差別可大了去!今天講透核心差異,小易幫你快速分清~
    的頭像 發(fā)表于 09-17 18:19 ?1405次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>:CWDM和DWDM的核心差異

    快速讀懂麥科信MOIP系列光隔離探頭

    ,滿足多樣化測試需求? 探頭支持0dB(1X)與20dB(100mX)檔位快速切換,并可通過搭配不同規(guī)格衰減器,實(shí)現(xiàn)從±0.01V至±6250V的寬范圍差模信號(hào)測量,且在全量程范圍內(nèi)均可實(shí)現(xiàn)滿量程輸出
    發(fā)表于 06-27 18:39

    柔性生產(chǎn)新標(biāo)配:聚徽解碼安卓工控機(jī)如何支持機(jī)多用」快速換線

    其獨(dú)特的技術(shù)優(yōu)勢,正逐漸成為柔性生產(chǎn)的新標(biāo)配,為「機(jī)多用」快速換線提供了有力支持。 協(xié)議兼容,打破設(shè)備連接壁壘 ()多協(xié)議解析能力 工業(yè)
    的頭像 發(fā)表于 06-10 16:48 ?664次閱讀

    請(qǐng)問ST25R3916有快速讀取嗎?

    ST25R3916有快速讀取嗎?
    發(fā)表于 04-25 06:41

    請(qǐng)問ST25R3916有快速讀取嗎?

    ST25R3916有快速讀取嗎?
    發(fā)表于 04-23 06:25