chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種可跨不同領(lǐng)域的異常檢測通用模型UniOD介紹

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:PaperWeekly ? 2026-03-18 09:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:PaperWeekly

TL;DR:本研究提出了一種可跨不同領(lǐng)域、適用于特征維度各異且特征空間異構(gòu)的數(shù)據(jù)集的異常檢測通用模型。

論文標題:

UniOD: A Universal Model for Outlier Detection across Diverse Domains

論文作者:

付達智,樊繼聰

收錄會議:

ICLR 2026

論文鏈接:

https://arxiv.org/abs/2507.06624

Highlights:

提出一種新穎的異常點檢測方法 UniOD:可利用歷史數(shù)據(jù)集中的知識,在面對全新、未見過的數(shù)據(jù)集時無需訓(xùn)練即可直接識別異常點。

相較于其他深度學(xué)習(xí)異常檢測方法,UniOD 僅需單一模型覆蓋多數(shù)據(jù)集場景;同時由于跳過重新訓(xùn)練,檢測階段計算開銷更低。

我們?yōu)?UniOD 的有效性提供了理論保證,并通過數(shù)值實驗驗證與理論結(jié)論相吻合。

在來自 ADbench 的 57 個來自多個不同領(lǐng)域的數(shù)據(jù)集上對比 17 種基線方法,UniOD 在多數(shù)場景下取得更優(yōu)性能。

引言

異常點(Outliers)是指在數(shù)據(jù)集中顯著偏離其他正常數(shù)據(jù)分布的觀測樣本,通常表明其可能來源于不同的生成機制。

在日益數(shù)據(jù)驅(qū)動的時代背景下,識別異常模式或偏離正常行為的現(xiàn)象——即異常檢測——已成為多個領(lǐng)域中的關(guān)鍵問題。

這類異常數(shù)據(jù)往往指示著關(guān)鍵事件的發(fā)生,例如金融欺詐、安全入侵、系統(tǒng)故障,或潛在的新知識發(fā)現(xiàn),因此對其進行準確而及時的檢測對于快速干預(yù)與科學(xué)決策具有至關(guān)重要的意義。

離群點檢測或異常檢測旨在發(fā)現(xiàn)完全無標簽數(shù)據(jù)集中的異常數(shù)據(jù),在各個領(lǐng)域中有廣泛的應(yīng)用。

wKgZPGm5-3yAClX2AAYL7XTCLaY166.jpg

如圖 1 所示,以往的異常檢測方法往往需要針對不同的數(shù)據(jù)集訓(xùn)練不同的模型。這意味著當(dāng)面對一個新的數(shù)據(jù)集——尤其是來自不同領(lǐng)域的數(shù)據(jù)集時——我們通常需要從零開始訓(xùn)練異常檢測模型,由此帶來以下局限性:

高成本的模型選擇與超參數(shù)調(diào)優(yōu): 尤其對于基于深度學(xué)習(xí)的異常檢測方法,需要確定網(wǎng)絡(luò)深度、網(wǎng)絡(luò)寬度、學(xué)習(xí)率以及方法特定的超參數(shù)。

如圖 2 所示,不同數(shù)據(jù)集對應(yīng)的最優(yōu)超參數(shù)組合差異顯著,從而帶來較大的調(diào)參與模型選擇難度。

wKgZO2m5-3yAcksZAAKWUM4kxds558.jpg

評估前計算開銷大、等待時間長:訓(xùn)練或擬合過程往往耗時,尤其是在模型規(guī)模和數(shù)據(jù)規(guī)模較大時更為明顯,導(dǎo)致部署前需要付出較高的計算成本并產(chǎn)生較長的等待周期。

未能有效利用歷史數(shù)據(jù)集中的知識:歷史數(shù)據(jù)集通常蘊含關(guān)于正常樣本與異常樣本模式的有用且可遷移知識,但傳統(tǒng)異常檢測方法難以將這些知識有效復(fù)用與遷移。

方法

為了解決上述問題,我們提出了一個通用異常檢測模型 - UniOD,該方法的核心思想是:該方法能夠利用來自不同領(lǐng)域的、帶標簽的歷史數(shù)據(jù)集(在大數(shù)據(jù)時代通常易于獲取)訓(xùn)練一個通用模型,從而在面對任意未見過領(lǐng)域的數(shù)據(jù)集時,無需進行任何重新訓(xùn)練即可檢測其中的異常點。

該方法的框架如下圖 3 所示。

wKgZO2m5-3yAECsKAAMp2taLgEQ950.jpg

2.1 Data Unification-構(gòu)建通用的數(shù)據(jù)

考慮到數(shù)據(jù)集尤其是表格數(shù)據(jù)集往往在維度、特征語義以及樣本規(guī)模等方面存在較大差異,如何統(tǒng)一特征空間是訓(xùn)練通用模型的關(guān)鍵步驟。

我們首先進行預(yù)處理,以統(tǒng)一其特征空間——標準化特征維度數(shù)量,并對每個特征的語義含義進行對齊與規(guī)范化。

我們的做法分為兩步:

將數(shù)據(jù)集表示為樣本級的相似度矩陣(即圖結(jié)構(gòu))。

對于數(shù)據(jù)集中的任意兩點,我們使用多個不同帶寬的高斯核函數(shù)計算其相似度。

基于相似度矩陣構(gòu)建統(tǒng)一特征。

我們對相似度矩陣使用奇異值分解得到每一個數(shù)據(jù)的特征。這樣得到的特征都是對相似度矩陣結(jié)構(gòu)的描述,因此不同數(shù)據(jù)集之間是可比的。

2.2 基于圖神經(jīng)網(wǎng)絡(luò)的模型設(shè)計

現(xiàn)在我們得到了數(shù)據(jù)的統(tǒng)一特征,需要解決的問題是:如何設(shè)計模型進行訓(xùn)練?

一個直接的想法是用 MLP 在歷史數(shù)據(jù)集上訓(xùn)練一個分類器,然而該方法不能充分利用相似度矩陣中所包含的有價值信息。

為了充分利用樣本間的相似度信息,我們把每一個數(shù)據(jù)集當(dāng)作圖結(jié)構(gòu)的數(shù)據(jù),這樣樣本級的異常檢測任務(wù)可以被轉(zhuǎn)化為圖節(jié)點級的異常檢測任務(wù),同時可以使用 GIN(圖同構(gòu)網(wǎng)絡(luò))和 transformer 并行的結(jié)構(gòu)作為我們的分類器。

2.3 理論分析

wKgZPGm5-3yANnBEAANXXKA4plc476.jpg

我們提出了如定理 4.1 所示的關(guān)于期望泛化誤差和平均訓(xùn)練誤差理論分析,該定理具有以下重要意義:

當(dāng)訓(xùn)練數(shù)據(jù)集數(shù)量更多(即 更大)時,理論上界會更緊,從而使得泛化誤差更小。

增大 GIN 與 transformer 的數(shù)量可以降低訓(xùn)練誤差,從而提高測試準確率

當(dāng) GIN 和 transformer 的層數(shù)過大時,UniOD 的泛化能力會減弱。

實驗

3.1 主要實驗結(jié)果

本文在常用的異常檢測基準 ADBench 的 30 個數(shù)據(jù)集上進行了測試,在歷史數(shù)據(jù)集的劃分上,我們隨機將這 30 個數(shù)據(jù)集劃分為兩組,其中一組作為歷史數(shù)據(jù)集,一組作為評估數(shù)據(jù)集,并做了交叉驗證。

評測指標采用了 AUROC 和 AUPRC,對所有基線方法均基于歷史數(shù)據(jù)集進行了超參數(shù)搜索。

wKgZPGm5-3yAaHyaAAm-1MXG7xA847.jpg

Table2 和 Table3 所示的實驗結(jié)果表明:UniOD 比起其他基線方法在大多數(shù)數(shù)據(jù)集以及平均性能上有較大優(yōu)勢。

wKgZO2m5-3yAFN7mAAtv_0e3W_0173.jpg

同時,我們也在 ADBench 的另外 27 個數(shù)據(jù)集上進行了測試,這 27 個數(shù)據(jù)集中包含圖像數(shù)據(jù)集與文本數(shù)據(jù)集(使用 ViT 和 BERT 提取特征),

Table19 中的實驗結(jié)果表明 UniOD 可以泛化到其他模態(tài)的數(shù)據(jù)集上,盡管只使用表格數(shù)據(jù)集訓(xùn)練。

wKgZPGm5-3yAYAwDAAgU2N5-1dU936.jpg

3.2 領(lǐng)域魯棒性分析

我們評估 UniOD 在物理、航天與圖像領(lǐng)域數(shù)據(jù)集上的表現(xiàn)時,同時在訓(xùn)練階段系統(tǒng)性移除所有來自相同領(lǐng)域/方向的歷史數(shù)據(jù)集。

在 Table15 中,排除這些領(lǐng)域特定的訓(xùn)練數(shù)據(jù)并未導(dǎo)致對應(yīng)測試領(lǐng)域的性能出現(xiàn)顯著下降。

wKgZPGm5-3yACacPAADTirlK7qs978.jpg

md

我們將這種魯棒性歸因于兩點關(guān)鍵因素:

即便同屬一個領(lǐng)域的數(shù)據(jù)集,其特征空間與數(shù)據(jù)特性也可能存在顯著差異;

UniOD 并不直接依賴原始特征,而是利用相似度矩陣來構(gòu)建跨數(shù)據(jù)集、維度一致的特征。因此,不同領(lǐng)域的數(shù)據(jù)集在其相似度矩陣中仍可能呈現(xiàn)相近的結(jié)構(gòu)模式,從而支持有效的跨領(lǐng)域泛化。

3.3 消融實驗

我們評估了在使用 1、3、5、10、15 個歷史訓(xùn)練數(shù)據(jù)集的情況下 UniOD 的性能變化,如圖 4(a) 所示??梢悦黠@觀察到,隨著歷史數(shù)據(jù)集數(shù)量的增加,模型的泛化性能相應(yīng)提升。

wKgZO2m5-3yAec-vAAMzqNw7ZmQ393.jpg

我們進一步分析了帶寬數(shù)量 對 UniOD 性能的影響。更大的 能夠帶來更少的信息損失,從而提升模型的泛化能力,如圖 4(b) 所示。上述實驗結(jié)果與定理的理論分析一致。

結(jié)論

本文提出了一種新穎且高效的異常點檢測方法 UniOD。其核心思想是利用歷史數(shù)據(jù)集訓(xùn)練一個通用深度模型,從而在無需重新訓(xùn)練的情況下,對來自不同領(lǐng)域的全新未見數(shù)據(jù)集進行異常檢測。

通過將每個數(shù)據(jù)集轉(zhuǎn)換為圖結(jié)構(gòu)數(shù)據(jù)并生成維度統(tǒng)一的節(jié)點特征,UniOD 使得單一模型即可處理異構(gòu)數(shù)據(jù)集成為可能。

我們從理論分析與實證實驗兩方面系統(tǒng)性地驗證了 UniOD 的有效性與高效性。

盡管 UniOD 主要面向傳導(dǎo)式(transductive)異常檢測場景設(shè)計,但其同樣可以擴展到歸納式(inductive)異常檢測:即通過將訓(xùn)練集與每個測試樣本轉(zhuǎn)換為圖結(jié)構(gòu)數(shù)據(jù),并計算其對應(yīng)的異常分數(shù),從而實現(xiàn)對新樣本的異常判別。

從研究的角度出發(fā),本文提出了異常檢測的新研究方向——通用異常檢測模型或異常檢測基礎(chǔ)模型。從工程與應(yīng)用的角度出發(fā),UniOD 不需要依賴于專業(yè)能力的調(diào)參或訓(xùn)練步驟,可以即插即用,降低了模型的使用門檻。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3810

    瀏覽量

    52249
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26258

原文標題:ICLR 2026 | 無需訓(xùn)練跨界泛化,UniOD用單一模型打通全領(lǐng)域異常檢測

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    使用商用電流檢測變壓器設(shè)計一種抗飽和的電路

    應(yīng)用抗變壓器飽和需求的電路。我們使用的模型為功率因數(shù)校正 (PFC) 拓撲。分析中將使用一種商用電流檢測變壓器,用于確定需要的參數(shù),了解如何利用這種信息設(shè)計一種
    發(fā)表于 07-18 07:36

    介紹一種按鍵檢測電路

    介紹一種按鍵檢測電路
    發(fā)表于 01-18 07:41

    入侵檢測系統(tǒng)中一種通用數(shù)據(jù)存儲模型

    提出了個適用于入侵檢測系統(tǒng)的通用數(shù)據(jù)模型,并分析了該模型的存儲結(jié)構(gòu)及其在入侵檢測
    發(fā)表于 06-29 08:20 ?13次下載

    基于危險模式的異常檢測模型

    闡述了危險模式的概況及運行機制,提出了一種基于危險模式的異常檢測模型以及相關(guān)的算法。該模型通過分析實時系統(tǒng)調(diào)用序列中的危險信號,進而判斷是否
    發(fā)表于 07-30 15:04 ?9次下載

    基于Q-學(xué)習(xí)算法的異常檢測模型

        針對網(wǎng)絡(luò)入侵的不確定性導(dǎo)致異常檢測系統(tǒng)誤報率較高的不足,提出一種基于Q-學(xué)習(xí)算法的異常檢測
    發(fā)表于 09-02 11:58 ?7次下載

    基于馬爾模型的臨床序列異常檢測

    針對單病臨床序列大都具有類似的時序頻繁模式,提出一種基于馬爾模型的臨床序列檢測模型。采用編
    發(fā)表于 02-22 15:57 ?10次下載

    基于隱馬爾模型的視頻異常檢測模型

    視頻技術(shù)的廣泛應(yīng)用帶來海量的視頻數(shù)據(jù),僅依靠人力對監(jiān)控視頻中的異常進行檢測是不太可能的。異常行為的自動化檢測在公共安全等領(lǐng)域的地位極其重要。
    發(fā)表于 11-20 09:37 ?8次下載
    基于隱馬爾<b class='flag-5'>可</b>夫<b class='flag-5'>模型</b>的視頻<b class='flag-5'>異常</b><b class='flag-5'>檢測</b><b class='flag-5'>模型</b>

    一種新的分布式入侵檢測模型

    針對現(xiàn)有分布式入侵檢測系統(tǒng)交互流量大、單點失效及檢測效率偏低的問題,基于人工免疫理論建立了一種新的分布式入侵檢測模型,并提出了
    發(fā)表于 02-05 14:34 ?0次下載

    模型的網(wǎng)絡(luò)異常流量檢測

    網(wǎng)絡(luò)流量的復(fù)雜性、難以預(yù)測性以及人們主觀評測的差異性等不確定因素,使得網(wǎng)絡(luò)流量的異常檢測成為網(wǎng)絡(luò)安全防護領(lǐng)域研究的難點問題。通過對流量安全特征的分析提取和范圍限定,引入云模型理論,提出
    發(fā)表于 03-06 16:44 ?1次下載
    云<b class='flag-5'>模型</b>的網(wǎng)絡(luò)<b class='flag-5'>異常</b>流量<b class='flag-5'>檢測</b>

    基于Greenshield模型異常節(jié)點檢測機制

    面向車輛自組網(wǎng)的安全通信問題,提出一種基于Greenshield模型異常節(jié)點檢測機制。結(jié)合車輛自組網(wǎng)的特點,構(gòu)造Greenshield模型
    發(fā)表于 03-29 09:54 ?0次下載

    基于時間卷積網(wǎng)絡(luò)的通用日志序列異常檢測框架

    基于循環(huán)神經(jīng)網(wǎng)絡(luò)的日志序列異常檢測模型對短序列有較好的檢測能力,但對長序列的檢測準確性較差。為此,提出
    發(fā)表于 03-30 10:29 ?8次下載
    基于時間卷積網(wǎng)絡(luò)的<b class='flag-5'>通用</b>日志序列<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>框架

    一種全新的高光譜數(shù)據(jù)異常檢測方法

    高光譜遙感技術(shù)為探索地物提供了豐富的信息,為異常檢測提供了更優(yōu)質(zhì)的數(shù)據(jù)源。但是在先驗信息未知的情況下,進行異常檢測仍是項非常具有挑戰(zhàn)性的工
    發(fā)表于 04-07 14:38 ?11次下載
    <b class='flag-5'>一種</b>全新的高光譜數(shù)據(jù)<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>方法

    一種多維時間序列汽車駕駛異常檢測模型

    針對傳統(tǒng)異常檢測模型難以準確分析汽車駕駛異常行為的情況,建立一種基于自動編碼器與孤立森林算法的多維時間序列汽車駕駛
    發(fā)表于 05-26 16:32 ?2次下載

    一種新的無監(jiān)督時間序列異常檢測方法

    時間序列數(shù)據(jù)是生活中常見的一種數(shù)據(jù),在時間順序上具有定規(guī)律,且大量存在于金融貿(mào)易、工業(yè)生產(chǎn)、環(huán)境保護、網(wǎng)絡(luò)安全等眾多領(lǐng)域。時間序列異常檢測
    的頭像 發(fā)表于 08-10 11:29 ?3928次閱讀

    介紹一種基于分層聚類方法的木馬通信行為檢測模型

    一種基于分層聚類方法的木馬通信行為檢測模型
    的頭像 發(fā)表于 07-30 11:51 ?1747次閱讀
    <b class='flag-5'>介紹</b><b class='flag-5'>一種</b>基于分層聚類方法的木馬通信行為<b class='flag-5'>檢測</b><b class='flag-5'>模型</b>