Deep Anomaly Detection with Deviation Networks

Feb 16, 2020 2 min read 0 Comments Anomaly Detection

Go to Project Site

1. どんなもの？

$\mathcal{X} = \{ x_1, x_2, \cdots, x_N, x_{N+1}, \cdots, x_{N+K} \}$ : training samples
$\mathcal{U} = \{ x_1, x_2, \cdots, x_N \}$ : unlabeled samples (正常データとごく少量の異常データ)
$\mathcal{K} = \{ x_{N+1}, x_{N+2}, \cdots, x_{N+K} \}$ : labeled samples (少量の異常データ)
$K « N$ : 異常データは少量
$\phi(x, \theta)$ : Scoring Network

Scoring NetworkからScoreを算出
Reference Scoreを算出
- 確率分布 $F$ から $l$ 個の乱数を生成
- $l$ 個の乱数から平均 $\mu_R$ と分散 $\sigma_R$ を算出
- なにかNNとかあるわけではないので注意
- $F$ は $\mathcal{N}(\mu=0, \sigma=1)$ ， $l=5000$ くらいで十分らしい
Deviation Lossを算出
- $x \sim \mathcal{U}$ なら $y=0$ (正常) deviationを $0$ に
- $x \sim \mathcal{K}$ なら $y=1$ (異常) deviationを $a$ に $\operatorname{dev}(\mathbf{x})=\frac{\phi(\mathbf{x} ; \Theta)-\mu_{\Re}}{\sigma_{\mathcal{R}}}$ $L\left(\phi(\mathbf{x} ; \Theta), \mu_{\mathcal{R}}, \sigma_{\mathcal{R}}\right)=(1-y)|dev(\mathbf{x})|+y \max (0, a-\operatorname{dev}(\mathbf{x}))$

様々なAD datasetでSoTA
- REPEN: limited labeld dataのAD
- Deep SVDD: AD．タスクに合わせてenhanceしたモデルを実装したとのこと
- prototypical networks (FSNet) : few-shot classification
- iForest: AD

$F$ が標準正規分布なら， $\mu_R=0$ ， $\sigma=0$ となってデータに全く依存しないReference Scoreになってるけどいいのか？
- この筆者の次の論文では解決されるらしい[1]
結局ミニバッチのサンプリングを $\mathcal{U}$ から半分， $\mathcal{K}$ から半分とってきてるのが大きそう

Pang, G., Shen, C., Jin, H., & Hengel, A. van den. (2019). Deep Weakly-supervised Anomaly Detection. Retrieved from https://arxiv.org/abs/1910.13601

My research interests are in computer vision, especially in anomaly detection and XAI.