Deep Anomaly Detection with Deviation Networks

1. どんなもの?

  • 大量の正常データと少量の異常データからAnomaly Detectionを行う
  • 枠組みとしてはDeep SVDDに近い

2. 先行研究と比べてどこがすごい?

  • 正常データからAnomaly Detectionモデルを作れるのは当たり前
  • 実利用においては,少量の異常データを如何にうまく使うかが求められる
  • end2end
    • AnoGANなどはnot end2end

3. 技術や手法の"キモ"はどこ?

  • 大量の正常データと少量の異常データからAnomaly Detectionを行う

変数の定義

  • X={x1,x2,,xN,xN+1,,xN+K} \mathcal{X} = \{ x_1, x_2, \cdots, x_N, x_{N+1}, \cdots, x_{N+K} \} : training samples
  • U={x1,x2,,xN}\mathcal{U} = \{ x_1, x_2, \cdots, x_N \} : unlabeled samples (正常データとごく少量の異常データ)
  • K={xN+1,xN+2,,xN+K}\mathcal{K} = \{ x_{N+1}, x_{N+2}, \cdots, x_{N+K} \} : labeled samples (少量の異常データ)
  • K«NK « N : 異常データは少量
  • ϕ(x,θ)\phi(x, \theta) : Scoring Network

Framework

  1. Scoring NetworkからScoreを算出

  2. Reference Scoreを算出

    • 確率分布FFからll個の乱数を生成
    • ll個の乱数から平均μR\mu_Rと分散σR\sigma_Rを算出
    • なにかNNとかあるわけではないので注意
    • FFN(μ=0,σ=1)\mathcal{N}(\mu=0, \sigma=1)l=5000l=5000くらいで十分らしい
  3. Deviation Lossを算出

    • xUx \sim \mathcal{U} なら y=0y=0 (正常) deviationを00
    • xKx \sim \mathcal{K} なら y=1y=1 (異常) deviationをaadev(x)=ϕ(x;Θ)μσR \operatorname{dev}(\mathbf{x})=\frac{\phi(\mathbf{x} ; \Theta)-\mu_{\Re}}{\sigma_{\mathcal{R}}} L(ϕ(x;Θ),μR,σR)=(1y)dev(x)+ymax(0,adev(x)) L\left(\phi(\mathbf{x} ; \Theta), \mu_{\mathcal{R}}, \sigma_{\mathcal{R}}\right)=(1-y)|dev(\mathbf{x})|+y \max (0, a-\operatorname{dev}(\mathbf{x}))

4. どうやって有効だと検証した?

  • 様々なAD datasetでSoTA
    • REPEN: limited labeld dataのAD
    • Deep SVDD: AD.タスクに合わせてenhanceしたモデルを実装したとのこと
    • prototypical networks (FSNet) : few-shot classification
    • iForest: AD

5. 議論はあるか?

  • FFが標準正規分布なら,μR=0\mu_R=0σ=0\sigma=0となってデータに全く依存しないReference Scoreになってるけどいいのか?
    • この筆者の次の論文では解決されるらしい[1]
  • 結局ミニバッチのサンプリングをU\mathcal{U}から半分,K\mathcal{K}から半分とってきてるのが大きそう

6. 次に読むべき論文はある?

  1. Pang, G., Shen, C., Jin, H., & Hengel, A. van den. (2019). Deep Weakly-supervised Anomaly Detection. Retrieved from https://arxiv.org/abs/1910.13601
Avatar
中塚 俊介
R&D Engineer

My research interests are in computer vision, especially in anomaly detection and XAI.