chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

到底是什么讓機器學習達不到我們的期待呢?

nlfO_thejiangme ? 2018-03-27 13:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器學習雖然能夠在很多地方顯示出強大的力量,同時也被集成到了很多的商業(yè)流程中去,但它依舊有一些不完美的地方,今天我們就通過一些典型的例子來深刻感受一下機器學習的局限性。

人臉識別

目前最先進的人臉識別系統(tǒng)可以達到99%的準確率。作為使用最為廣泛的機器學習算法,人臉識別得到了飛速的發(fā)展,但在這背后需要我們對幾件事情保持清醒。首先,99%的正確率是來自與驗證數(shù)據(jù)集的測試結(jié)果,而驗證數(shù)據(jù)集則來自于與訓練數(shù)據(jù)集相同的數(shù)據(jù)集,并從中隨機抽取。這就意味著數(shù)據(jù)的均值和方差與訓練數(shù)據(jù)十分相似。但當我們將系統(tǒng)置于真實情況下時,實際照片的特性與訓練數(shù)據(jù)不可能相同,那么實際的精度很有可能低于99%。

模型有時候會將其他的東西識別成人臉(假陽性)或者忘卻漏掉了人臉(假陰性)。不同的模型在不同的階段有著不同的表現(xiàn),在使用時你需要確定你需要什么樣層次的模型,給出多高的精度是可以接受的。在選擇權(quán)衡算法時,一個模型在檢測幾千張臉時錯檢幾十張,而另一個模型可以將準確率提高一半但需要10x的處理時間和運算,那么前者將會是不錯的選擇。剩下的可以交給人類來做,我們對于少量假陽性和假陰性的樣本有著非??斓臏蚀_識別能力。

下面是幾個關(guān)于模型訓練的數(shù)據(jù)清理經(jīng)驗。最好的當然是保證每一張臉都可以很容易地看到,沒有模糊遮擋,也沒有很奇怪的角度。同時圖像要保持適度的分辨率,分辨率太高的圖像容易引入造成算法失效的噪音。

光學字符識別(OCR)

目前最先進的光學字符識別系統(tǒng)對于文件的識別與排版已經(jīng)有十分優(yōu)異?;谶吘墮z測、計算機視覺與字符識別的技術(shù)使得OCR不斷改進,對于掃描文檔幾乎沒有障礙了。

但目前OCR還不能夠勝任的是非掃描文件的識別,這也是驗證碼還能作為網(wǎng)站人類識別的功能存在。人類對于字母識別有著無與倫比的能力,無論是模糊、扭曲、顏色不同都不在話下,而計算機望塵莫及。

OCR很有用但對于一些場景下使用不當就會文不對題,下面這張球賽的截頻就是一個典型的例子。

上圖如果用OCR識別很有可能生成這樣的一大串:

[0] PREMIER LEAGUE [1] TOT 2 [2] M [3] U [4] 0 [5] 36:2 [6] 4 [7] SPORTS [8] NEW 0 BUR 0 [9] HALFTIME [10] LIVE [11] NBCSN

如果沒有上下文語境我們很難明白識別出的意思,哪里是隊名哪里是logo?這會造成很大的混亂。

我們不應該像使用通用OCR一樣來直接簡單粗暴的套用,而是需要針對情況進行分析。對于上面的例子如果我們想要追蹤球員,那么目標追蹤的方法會很好,但如果想要追蹤比賽分數(shù)和時間,那么將OCR限定在固定區(qū)域中會是不錯的選擇。

視 頻

視頻是一種很神奇的存在,雖然很多機器學習模型能在視頻上實現(xiàn)和照片一樣的效果,但總會有意想不到的情況。數(shù)字世界的解碼和封裝總是與視頻的壓縮率和長寬比耦合在一起。

同時考慮到處理時間和算力的限制,對視頻進行處理時我們往往選擇低分辨的格式。當你選擇低分辨率或者較高的壓縮時,視頻并不會是一組連續(xù)的靜態(tài)圖片,所以計算機視覺的識別方法將會與靜態(tài)圖片中的識別方法有很大的差別。

為了說明這一情況我們可以隨便點開一個視頻并暫停,如下圖所示。人們的臉變得模糊、角度和整體形象都顯得和靜態(tài)下十分不同。

下面應該是計算機看到的人臉區(qū)域:

你能從中認出圖中的主角是誰嗎?如果對你來說很困難那么對于計算機來說也不容易!

對于人類來說,在視頻中識別人臉很容易,但要把獨立的幀抽取出來你會發(fā)現(xiàn)圖像質(zhì)量出乎意料的差。

但我們也不能否定機器學習,因為機器學習在大多數(shù)情況下對于視頻的自動化分類和標注時十分重要的手段。我們需要明白的是我們期望得到的結(jié)果以及如何去修正模型實際的表現(xiàn)。如果一個龐大的全球名人識別模型對一段視屏進行檢測可能會出現(xiàn)很多假陽性的結(jié)果,但是如果使用一個僅僅包含幾個著名人士的模型來檢測則會得到好得多的結(jié)果。如果你的模型表現(xiàn)不好,你還可以從數(shù)據(jù)的角度來改進,譬如說某個節(jié)目中人臉出現(xiàn)的位置就可以作為先驗知識來幫助機器提高正確率。我們需要嘗試不同的模型和工作流總能取得成功。

如何成功的應用機器學習?

機器學習十分強大,有人將它應用于檢測學術(shù)造假的論文,也有人將它應用于人臉身份認證、不良內(nèi)容的裸露檢測等。同樣也用于為用戶推薦商品和服務的推薦引擎上,在這樣的場景下假陽性和假陰性的推薦結(jié)果不會造成太大影響,事實上一些異常推薦還為用戶探索新事物提供了條件。

還有改善搜索引擎的個性化能力,檢測農(nóng)作物動物的疾病以及預測產(chǎn)量等等方面。機器學習將會有無數(shù)的應用,我們對它充滿期待,但同時也會把握住期待的方向讓機器學習正常運轉(zhuǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人臉識別
    +關(guān)注

    關(guān)注

    77

    文章

    4127

    瀏覽量

    88376
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8551

    瀏覽量

    136820

原文標題:靈魂拷問:是什么讓機器學習達不到我們的期待呢?(開頭有個大事兒)

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    強化學習自動駕駛模型學習更快嗎?

    是一種機器通過“試錯”學會決策的辦法。與監(jiān)督學習不同,監(jiān)督學習是有人提供示范答案,模型去模仿;而強化
    的頭像 發(fā)表于 01-31 09:34 ?599次閱讀
    強化<b class='flag-5'>學習</b>會<b class='flag-5'>讓</b>自動駕駛模型<b class='flag-5'>學習</b>更快嗎?

    MOS管到底是什么?和三極管、繼電器有什么本質(zhì)區(qū)別?

    出現(xiàn)的“實力派選手”,常常被與三極管、繼電器放在一起比較。不少人在選型時會困惑:MOS管到底是什么?它和我們熟悉的三極管、繼電器,核心差異又在哪里?今天就用通俗的語言拆解清楚
    的頭像 發(fā)表于 01-07 13:46 ?412次閱讀
    MOS管<b class='flag-5'>到底是</b>什么?和三極管、繼電器有什么本質(zhì)區(qū)別?

    PCB加工中的“流膠”到底是怎么影響阻抗的?

    是好事,高速先生支持每一個有夢想的人。但是光有夢想肯定控不好阻抗,高速先生一定會把你們搖醒,你們好好思考下到底有什么因素會影響加工的阻抗誤差哈! 影響阻抗的因素有很多,高速先生之前文章也寫過不少
    發(fā)表于 12-23 10:14

    IGBT到底是什么?-從名稱入手來帶您了解

    對于工作需要用到IGBT、但從未專業(yè)學習過IGBT的人來說, IGBT到底是什么、它為什么叫IGBT、它的核心關(guān)鍵詞是什么、要怎么理解它 等一系列問題并無法一次性在某個地方獲取到,都需要查閱大量的資料,學習大量的基礎(chǔ)才能有個初步
    的頭像 發(fā)表于 11-25 17:38 ?1404次閱讀
    IGBT<b class='flag-5'>到底是</b>什么?-從名稱入手來帶您了解

    驅(qū)動芯片到底有多重要?這些黑科技電子設(shè)備飛起來!

    你知道嗎? 驅(qū)動芯片 就像電子設(shè)備的心臟,沒有它,你的手機、電腦、智能家電統(tǒng)統(tǒng)都會變成廢鐵!但這么重要的東西,99%的人卻對它一無所知。 驅(qū)動芯片到底是什么鬼? 簡單來說,驅(qū)動芯片就是控制其他
    的頭像 發(fā)表于 11-25 08:37 ?391次閱讀
    驅(qū)動芯片<b class='flag-5'>到底</b>有多重要?這些黑科技<b class='flag-5'>讓</b>電子設(shè)備飛起來!

    請問Keil中的map文件到底是什么意思?

    Keil中的map文件到底是什么意思?里面是如何進行相關(guān)執(zhí)行操作的
    發(fā)表于 11-25 06:59

    單片機和嵌入式,到底是什么關(guān)系?

    很多人初次接觸嵌入式開發(fā)時,都會聽到一句話:“嵌入式其實就是單片機。”可當你真正開始學習時,會發(fā)現(xiàn)嵌入式和單片機雖然經(jīng)?!袄墶痹谝黄鹛?,但它們好像又不是一回事。這篇文章,我們就來厘清這兩個概念
    的頭像 發(fā)表于 11-14 10:28 ?1368次閱讀
    單片機和嵌入式,<b class='flag-5'>到底是</b>什么關(guān)系?

    RFID電子標簽:生活和工作開掛的神奇科技

    出門過ETC不用停車、超市結(jié)賬不用挨個掃碼、酒店開門不用插鑰匙 —— 你有沒有發(fā)現(xiàn),這些生活變便捷的場景里,都藏著同一個 “幕后功臣”:RFID電子標簽。這個看似不起眼的小技術(shù),早已悄悄滲透到我們
    的頭像 發(fā)表于 11-13 10:06 ?480次閱讀

    單片機的差分信號到底是什么?

    差分信號到底是什么?通俗來講,就是驅(qū)動端發(fā)送兩個等值、反相的信號,接收端通過比較這兩個電壓的差值來判斷邏輯狀態(tài)“0”還是“1”。 差分信號的產(chǎn)生是由輸入源發(fā)出信號后經(jīng)過緩沖器和倒相器后,所產(chǎn)生
    發(fā)表于 11-12 06:44

    IEC 到底是什么?為什么它能影響全球?

    IEC 到底是什么?為什么它能影響全球?
    的頭像 發(fā)表于 09-04 17:07 ?3474次閱讀

    晶振的 “負載電容” 到底是什么

    負載電容,到底是什么? 負載電容,簡單來說,是指晶振的兩條引線連接IC塊內(nèi)部及外部所有有效電容之和,我們可以將其看作晶振片在電路中串接的電容。從更專業(yè)的角度講,它是為了使晶振能夠在其標稱頻率下穩(wěn)定
    的頭像 發(fā)表于 07-25 16:26 ?1047次閱讀

    請問編譯純rtos到底是選擇Linux+rtos的sdk編譯only rtos還是直接使用rtos sdk?

    編譯純rtos到底是選擇Linux+rtos的sdk編譯only rtos還是直接使用rtos sdk?
    發(fā)表于 07-11 07:22

    智能盒子到底是什么東西?昇騰310深度測評:為何能成為行業(yè)新寵?

    人摸不著頭腦的“智能盒子”。各位搞技術(shù)、搞工程的朋友,咱們在工作中是不是經(jīng)常聽到“智能盒子”這個說法?每次聽到這個詞,我猜很多人心里都在犯嘀咕:這東西到底是個啥玩意兒?難道就是個裝了點智能軟件的普通盒子?它到底有啥用?能給咱們
    的頭像 發(fā)表于 04-27 10:46 ?1840次閱讀
    智能盒子<b class='flag-5'>到底是</b>什么東西?昇騰310深度測評:為何能成為行業(yè)新寵?

    一文給你講透!DA板卡到底是什么?它和主板又有哪些不同?

    大家好,我是老王,在電子行業(yè)干了十幾年,今天我就用“大白話”給大家講講DA板卡到底是啥,它和咱們常說的“主板”有啥區(qū)別。文章里會穿插一些表格和實際案例,保證你讀完不僅能懂,還能跟朋友吹牛!
    的頭像 發(fā)表于 04-24 16:48 ?2243次閱讀
    一文給你講透!DA板卡<b class='flag-5'>到底是</b>什么?它和主板又有哪些不同?

    ST25R3916B輸出功率達不到1.6W,與手冊不符是怎么回事?

    ST25R3916B輸出功率達不到1.6W
    發(fā)表于 03-13 06:02