chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)中的幾種數(shù)據(jù)偏差

Dbwd_Imgtec ? 來(lái)源:Imagination Tech ? 作者:Hengtee Lim ? 2021-01-05 17:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機(jī)器學(xué)習(xí)中的數(shù)據(jù)偏差是一種錯(cuò)誤,其中數(shù)據(jù)集的某些元素比其他元素具有更大的權(quán)重和或表示。有偏見的數(shù)據(jù)集不能準(zhǔn)確地表示模型的用例,從而導(dǎo)致結(jié)果偏斜,準(zhǔn)確性水平低和分析錯(cuò)誤。

通常,用于機(jī)器學(xué)習(xí)項(xiàng)目的訓(xùn)練數(shù)據(jù)必須代表現(xiàn)實(shí)世界。這很重要,因?yàn)檫@些數(shù)據(jù)是機(jī)器學(xué)習(xí)如何完成其工作的方式。數(shù)據(jù)偏差可能會(huì)發(fā)生在從人類報(bào)告和選擇偏差到算法和解釋偏差的一系列區(qū)域中。

解決機(jī)器學(xué)習(xí)項(xiàng)目中的數(shù)據(jù)偏差意味著首先確定它在哪里。只有在知道存在偏見的地方之后,你才可以采取必要的措施來(lái)糾正它,無(wú)論是解決數(shù)據(jù)不足還是改善注釋過程的問題??紤]到這一點(diǎn),請(qǐng)務(wù)必對(duì)數(shù)據(jù)的范圍,質(zhì)量和處理保持警惕,以免產(chǎn)生偏差。這不僅影響模型的準(zhǔn)確性,而且還會(huì)涉及道德,公平和包容性問題。

下面,我列出了機(jī)器學(xué)習(xí)中最常見的7種數(shù)據(jù)偏見類型,以幫助你分析和了解其發(fā)生的位置以及你可以采取的措施。

數(shù)據(jù)偏差的類型

盡管并不詳盡,但此列表包含了該領(lǐng)域中數(shù)據(jù)偏見的常見示例,以及其發(fā)生位置的示例。

樣本偏差:當(dāng)數(shù)據(jù)集不能反映模型將在其中運(yùn)行的環(huán)境的實(shí)際情況時(shí),就會(huì)發(fā)生樣本偏差。這樣的一個(gè)例子是某些主要在白人圖像上訓(xùn)練的面部識(shí)別系統(tǒng)。這些模型對(duì)婦女和不同種族的人的準(zhǔn)確度要低得多。此偏差的另一個(gè)名稱是選擇偏差。

排除偏差:排除偏差在數(shù)據(jù)預(yù)處理階段最常見。通常,這是刪除不重要的有價(jià)值數(shù)據(jù)的情況。但是,由于某些信息的系統(tǒng)排除,它也可能發(fā)生。例如,假設(shè)你有一個(gè)在美國(guó)和加拿大的客戶銷售數(shù)據(jù)集。98%的客戶來(lái)自美國(guó),因此你選擇刪除不相關(guān)的位置數(shù)據(jù)。但是,這意味著你的模型將不會(huì)因?yàn)榧幽么罂蛻舻南M(fèi)增加兩倍多這一事實(shí)而受到影響。

測(cè)量偏差:當(dāng)為訓(xùn)練而收集的數(shù)據(jù)與現(xiàn)實(shí)世界中收集的數(shù)據(jù)不同時(shí),或者當(dāng)錯(cuò)誤的測(cè)量結(jié)果導(dǎo)致數(shù)據(jù)失真時(shí),就會(huì)發(fā)生這種偏差。這種偏差的一個(gè)很好的例子出現(xiàn)在圖像識(shí)別數(shù)據(jù)集中,其中訓(xùn)練數(shù)據(jù)是用一種類型的照相機(jī)收集的,而生產(chǎn)數(shù)據(jù)是用另一種照相機(jī)收集的。在項(xiàng)目的數(shù)據(jù)標(biāo)記階段,由于注釋不一致也會(huì)導(dǎo)致測(cè)量偏差。

召回偏差:這是一種測(cè)量偏差,在項(xiàng)目的數(shù)據(jù)標(biāo)記階段很常見。當(dāng)你不一致地標(biāo)記相似類型的數(shù)據(jù)時(shí),就會(huì)產(chǎn)生召回偏差。這導(dǎo)致較低的精度。例如,假設(shè)你有一個(gè)團(tuán)隊(duì)將電話的圖像標(biāo)記為損壞,部分損壞或未損壞。如果有人將一張圖像標(biāo)記為已損壞,但將相似的圖像標(biāo)記為部分已損壞,則你的數(shù)據(jù)將不一致。

觀察者偏差:也稱為確認(rèn)偏差,觀察者偏差是看到你期望在數(shù)據(jù)中看到或想要看到的結(jié)果的效果。當(dāng)研究人員在有意識(shí)或無(wú)意識(shí)的情況下對(duì)自己的研究有主觀想法進(jìn)入項(xiàng)目時(shí),可能會(huì)發(fā)生這種情況。當(dāng)標(biāo)簽制作者讓主觀思想控制他們的標(biāo)簽制作習(xí)慣,從而導(dǎo)致數(shù)據(jù)不準(zhǔn)確時(shí),你也可以看到這一點(diǎn)。

種族偏見:盡管不是傳統(tǒng)意義上的數(shù)據(jù)偏見,但由于其在AI技術(shù)中的盛行,因此仍然值得一提。當(dāng)數(shù)據(jù)偏向特定人群時(shí),就會(huì)發(fā)生種族偏見。在面部識(shí)別和自動(dòng)語(yǔ)音識(shí)別技術(shù)中可以看到這一點(diǎn),該技術(shù)無(wú)法像白種人那樣準(zhǔn)確地識(shí)別有色人種。Google的Inclusive Images競(jìng)賽提供了很好的例子說(shuō)明了這種情況的發(fā)生。

關(guān)聯(lián)偏差:當(dāng)機(jī)器學(xué)習(xí)模型的數(shù)據(jù)加強(qiáng)和/或乘以文化偏差時(shí),就會(huì)發(fā)生這種偏差。你的數(shù)據(jù)集可能包含一組工作,其中所有男性都是醫(yī)生,所有女性都是護(hù)士。這并不意味著女人不能當(dāng)醫(yī)生,男人不能當(dāng)護(hù)士。但是,就你的機(jī)器學(xué)習(xí)模型而言,不存在女醫(yī)生和男護(hù)士。社交偏見最出名的是造成性別偏見,這在“挖掘人工智能”研究中可見。

如何避免機(jī)器學(xué)習(xí)項(xiàng)目中的數(shù)據(jù)偏差?

防止機(jī)器學(xué)習(xí)項(xiàng)目中的數(shù)據(jù)偏差是一個(gè)持續(xù)的過程。盡管有時(shí)很難知道數(shù)據(jù)或模型何時(shí)出現(xiàn)偏差,但是你可以采取許多步驟來(lái)幫助防止偏差或及早發(fā)現(xiàn)偏差。盡管遠(yuǎn)非詳盡的清單,但以下要點(diǎn)為思考機(jī)器學(xué)習(xí)項(xiàng)目的數(shù)據(jù)偏差提供了入門級(jí)指南。

盡你所能,事先研究用戶。請(qǐng)注意你的一般用例和潛在異常值。

確保你的數(shù)據(jù)科學(xué)家和數(shù)據(jù)標(biāo)簽團(tuán)隊(duì)是多元化的。

盡可能合并來(lái)自多個(gè)來(lái)源的輸入以確保數(shù)據(jù)多樣性。

為數(shù)據(jù)標(biāo)簽創(chuàng)建黃金標(biāo)準(zhǔn)。黃金標(biāo)準(zhǔn)是一組數(shù)據(jù),可以反映任務(wù)的理想標(biāo)記數(shù)據(jù)。它使你能夠測(cè)量團(tuán)隊(duì)的注釋的準(zhǔn)確性。

為數(shù)據(jù)標(biāo)簽期望制定明確的準(zhǔn)則,以便數(shù)據(jù)標(biāo)簽保持一致。

對(duì)于可能會(huì)出現(xiàn)數(shù)據(jù)準(zhǔn)確性偏差的任何項(xiàng)目,請(qǐng)使用多次通過注釋。例如,情感分析,內(nèi)容審核和意圖識(shí)別。

尋求具有領(lǐng)域?qū)I(yè)知識(shí)的人員的幫助,以查看你收集和/或注釋的數(shù)據(jù)。團(tuán)隊(duì)外部的人可能會(huì)看到團(tuán)隊(duì)忽略的偏見。

定期分析你的數(shù)據(jù)。跟蹤錯(cuò)誤和問題區(qū)域,以便您快速響應(yīng)并解決它們。在決定刪除或保留它們之前,請(qǐng)仔細(xì)分析數(shù)據(jù)點(diǎn)。

使偏差測(cè)試成為開發(fā)周期的一部分。Google,IBM和Microsoft都發(fā)布了工具和指南,以幫助分析許多不同數(shù)據(jù)類型的偏差。

如果你想更深入地了解偏見的產(chǎn)生方式,偏見對(duì)機(jī)器學(xué)習(xí)模型的影響以及過去在自動(dòng)化技術(shù)中的偏見,我建議你參考瑪格麗特·米切爾(Margaret Mitchell)的“人工智能的視野和語(yǔ)言偏見”演示。

鏈接:https://web.stanford.edu/class/archive/cs/cs224n/cs224n.1194/slides/cs224n-2019-lecture19-bias.pdf?ref=hackernoon.com

總結(jié)

請(qǐng)務(wù)必注意任何數(shù)據(jù)項(xiàng)目在機(jī)器學(xué)習(xí)中的潛在偏見。通過盡早安裝正確的系統(tǒng)并保持?jǐn)?shù)據(jù)收集,標(biāo)記和實(shí)施的最頂層,你可以在出現(xiàn)問題之前就注意到它,或者在出現(xiàn)問題時(shí)對(duì)其進(jìn)行響應(yīng)。

責(zé)任編輯:xj

原文標(biāo)題:機(jī)器學(xué)習(xí)中的7種數(shù)據(jù)偏見

文章出處:【微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:機(jī)器學(xué)習(xí)中的7種數(shù)據(jù)偏見

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    為何你的機(jī)器人手臂“知覺”存在偏差?探秘力傳感器的奧秘

    ,甚至安裝時(shí)的小角度偏差都算出來(lái),最后實(shí)現(xiàn)精準(zhǔn)的重力補(bǔ)償,讓傳感器只反饋我們關(guān)心的“外部力”。整個(gè)過程不需要啥昂貴的校準(zhǔn)設(shè)備,核心就是數(shù)學(xué)和編程。我會(huì)盡量用大白話把原理說(shuō)透,再附上能直接運(yùn)行的Python代碼。不管你是學(xué)機(jī)器人的學(xué)生,還是現(xiàn)場(chǎng)干活的工程師,都能跟著一步步做
    發(fā)表于 04-13 15:25

    振弦式應(yīng)變計(jì)安裝時(shí)角度偏差會(huì)導(dǎo)致數(shù)據(jù)誤差嗎?

    振弦式應(yīng)變計(jì)的安裝精度是保證其測(cè)量數(shù)據(jù)準(zhǔn)確可靠的關(guān)鍵前提之一。安裝時(shí)產(chǎn)生的角度偏差,確實(shí)會(huì)直接影響測(cè)量結(jié)果的準(zhǔn)確性。從儀器的工作原理分析,振弦式應(yīng)變計(jì)的設(shè)計(jì)初衷是精確測(cè)量其軸線方向上的變形。當(dāng)儀器
    的頭像 發(fā)表于 03-20 13:32 ?435次閱讀
    振弦式應(yīng)變計(jì)安裝時(shí)角度<b class='flag-5'>偏差</b>會(huì)導(dǎo)致<b class='flag-5'>數(shù)據(jù)</b>誤差嗎?

    機(jī)器學(xué)習(xí)特征工程:分類變量的數(shù)值化處理方法

    編碼是機(jī)器學(xué)習(xí)流程里最容易被低估的環(huán)節(jié)之一,模型沒辦法直接處理文本形式的分類數(shù)據(jù),尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類
    的頭像 發(fā)表于 02-10 15:58 ?443次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>特征工程:分類變量的數(shù)值化處理方法

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問世以來(lái),多個(gè)在線領(lǐng)域的數(shù)字化格局迎來(lái)了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競(jìng)爭(zhēng)優(yōu)勢(shì),而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 02-04 14:44 ?663次閱讀

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)需避免的 7 個(gè)常見錯(cuò)誤與局限性

    無(wú)論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)
    的頭像 發(fā)表于 01-07 15:37 ?343次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>中</b>需避免的 7 個(gè)常見錯(cuò)誤與局限性

    電能質(zhì)量在線監(jiān)測(cè)裝置能測(cè)頻率偏差嗎?

    )的波動(dòng),輸出頻率偏差值、頻率波動(dòng)率等關(guān)鍵數(shù)據(jù),為電網(wǎng)調(diào)度、穩(wěn)定控制提供依據(jù)。 一、為什么能測(cè)?核心測(cè)量原理 電能質(zhì)量在線監(jiān)測(cè)裝置通過 “ 高精度采樣 + 基波頻率提取算法 ” 實(shí)現(xiàn)頻率偏差測(cè)量,核心步驟可拆解為 3 步,確保測(cè)
    的頭像 發(fā)表于 10-13 17:48 ?1372次閱讀

    【新啟航】深度學(xué)習(xí)在玻璃晶圓 TTV 厚度數(shù)據(jù)智能分析的應(yīng)用

    一、引言 玻璃晶圓總厚度偏差(TTV)是衡量晶圓質(zhì)量的關(guān)鍵指標(biāo),其精確分析對(duì)半導(dǎo)體制造、微流控芯片等領(lǐng)域至關(guān)重要 。傳統(tǒng) TTV 厚度數(shù)據(jù)分析方法依賴人工或簡(jiǎn)單算法,效率低且難以挖掘數(shù)據(jù)潛在規(guī)律
    的頭像 發(fā)表于 10-11 13:32 ?781次閱讀
    【新啟航】深度<b class='flag-5'>學(xué)習(xí)</b>在玻璃晶圓 TTV 厚度<b class='flag-5'>數(shù)據(jù)</b>智能分析<b class='flag-5'>中</b>的應(yīng)用

    量子機(jī)器學(xué)習(xí)入門:三種數(shù)據(jù)編碼方法對(duì)比與應(yīng)用

    在傳統(tǒng)機(jī)器學(xué)習(xí)數(shù)據(jù)編碼確實(shí)相對(duì)直觀:獨(dú)熱編碼處理類別變量,標(biāo)準(zhǔn)化調(diào)整數(shù)值范圍,然后直接輸入模型訓(xùn)練。整個(gè)過程更像是數(shù)據(jù)清洗,而非核心算法組
    的頭像 發(fā)表于 09-15 10:27 ?938次閱讀
    量子<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>入門:三<b class='flag-5'>種數(shù)據(jù)</b>編碼方法對(duì)比與應(yīng)用

    有哪些具體的方法可以減少電能質(zhì)量監(jiān)測(cè)裝置的數(shù)據(jù)偏差?

    LZ-300C電能質(zhì)量在線監(jiān)測(cè)裝置 減少電能質(zhì)量監(jiān)測(cè)裝置的數(shù)據(jù)偏差,需從硬件設(shè)計(jì)、校準(zhǔn)溯源、環(huán)境控制、算法優(yōu)化、安裝維護(hù)等多環(huán)節(jié)入手,結(jié)合新能源并網(wǎng)場(chǎng)景的特殊性(如強(qiáng)電磁干擾、諧波豐富、波動(dòng)頻繁
    的頭像 發(fā)表于 08-21 09:33 ?751次閱讀
    有哪些具體的方法可以減少電能質(zhì)量監(jiān)測(cè)裝置的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>偏差</b>?

    如何判斷電能質(zhì)量監(jiān)測(cè)裝置的數(shù)據(jù)偏差是否在允許范圍內(nèi)?

    LZ-DZ200電能質(zhì)量在線監(jiān)測(cè)裝置 判斷電能質(zhì)量監(jiān)測(cè)裝置的數(shù)據(jù)偏差是否在允許范圍內(nèi),需結(jié)合標(biāo)準(zhǔn)規(guī)范、裝置精度等級(jí)、測(cè)量參數(shù)類型及實(shí)際應(yīng)用場(chǎng)景(如新能源并網(wǎng)的特殊要求)綜合評(píng)估,核心是將實(shí)測(cè)偏差
    的頭像 發(fā)表于 08-21 09:28 ?1582次閱讀
    如何判斷電能質(zhì)量監(jiān)測(cè)裝置的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>偏差</b>是否在允許范圍內(nèi)?

    實(shí)際運(yùn)行,電能質(zhì)量監(jiān)測(cè)裝置常見的數(shù)據(jù)偏差(如漂移、跳變)由哪些原因?qū)е拢?/a>

    LZ-DZ200A電能質(zhì)量在線監(jiān)測(cè)裝置 在實(shí)際運(yùn)行,電能質(zhì)量監(jiān)測(cè)裝置的數(shù)據(jù)偏差(如漂移、跳變)往往是多因素共同作用的結(jié)果,尤其在新能源并網(wǎng)場(chǎng)景,因電力電子設(shè)備密集、電磁環(huán)境復(fù)雜,
    的頭像 發(fā)表于 08-21 09:23 ?1622次閱讀
    實(shí)際運(yùn)行<b class='flag-5'>中</b>,電能質(zhì)量監(jiān)測(cè)裝置常見的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>偏差</b>(如漂移、跳變)由哪些原因?qū)е拢? />    </a>
</div>                              <div   id=

    高溫季負(fù)荷激增,電壓偏差影響電機(jī)效率?電能質(zhì)量監(jiān)測(cè)必不可少

    電壓偏差的成因復(fù)雜,可能源于電網(wǎng)供電波動(dòng)、廠區(qū)負(fù)荷突變或變壓器分接頭設(shè)置不合理等。在缺乏量化數(shù)據(jù)的情況下,問題溯源往往面臨挑戰(zhàn)。 CET電能質(zhì)量監(jiān)測(cè)方案提供“全周期、多維度”的數(shù)據(jù)記錄,為偏差
    的頭像 發(fā)表于 08-04 15:09 ?1161次閱讀
    高溫季負(fù)荷激增,電壓<b class='flag-5'>偏差</b>影響電機(jī)效率?電能質(zhì)量監(jiān)測(cè)必不可少

    FPGA在機(jī)器學(xué)習(xí)的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無(wú)法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門陣列)作為一種靈活且高效的硬件加速平臺(tái)
    的頭像 發(fā)表于 07-16 15:34 ?3085次閱讀

    使用MATLAB進(jìn)行無(wú)監(jiān)督學(xué)習(xí)

    無(wú)監(jiān)督學(xué)習(xí)是一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。無(wú)監(jiān)督學(xué)習(xí)旨在識(shí)別數(shù)據(jù)
    的頭像 發(fā)表于 05-16 14:48 ?1591次閱讀
    使用MATLAB進(jìn)行無(wú)監(jiān)督<b class='flag-5'>學(xué)習(xí)</b>

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    相機(jī)標(biāo)定是視覺系統(tǒng)的基石,直接影響后續(xù)圖像處理的精度。書中詳細(xì)介紹了單目和雙目相機(jī)的標(biāo)定流程,包括標(biāo)定板的使用、參數(shù)優(yōu)化以及標(biāo)定文件的應(yīng)用。 實(shí)際應(yīng)用,標(biāo)定誤差可能導(dǎo)致機(jī)器人定位偏差,因此標(biāo)定過程
    發(fā)表于 05-03 19:41