1. どんなもの?
- Pretrained Modelを用いた異常検知モデル
- CFLOW-ADを改良した2DFlowで密度推定を行うことで異常度を算出する
2. 先行研究と比べてどこがすごい?
- Feature Extractorとして,ViTを採用
- 局所的情報と大域的情報を考慮したFeature Mapを利用可能
- 2D FlowでFeature Map全体の情報を用いて密度推定
- CFLOW-ADはFeature Mapのポジション毎のベクトルを入力とし,NFで密度推定していた
3. 技術や手法の"キモ"はどこ?
Feature Extractor
- ViTを採用
- 局所的情報と大域的情報を考慮したFeature Mapを利用可能
- Feature MapはPyramidではなく,特定の1つの層のFeature Mapを利用
2D Flow
-
Feature Mapに対して,Conv層を繰り返すNF
- RealNVPやGLOWから,Multiscaleアーキテクチャを抜いたような感じ
-
NFの尤度関数は定番のこれ
- $x = z_k $ : 入力データ
- $ f_k $ : 変換関数
- $ z_k = f_k(z_{k-1})$
-
変換関数を図の(b)のようにする.数式は以下
- $s(y_a)$,$b(y_b)$がConvReLUConvの出力をSplitしたもの
- 以下の数式を2回適用すると,図(b)と等価になる
4. どうやって有効だと検証した?
-
MVTec ADに対して実験
- Image-level AUROCでSoTA更新
- CFLOW-ADよりも高速
-
BTADでも実験
-
Feature Extacorによる比較
5. 議論はあるか?
- なぜGlowを使ってないのか?