1. どんなもの?
- ImageNetで事前学習済みモデルを利用した異常検知
- 事前学習モデルで得られる特徴Mapを用いる
- MVTecでSoTA
2. 先行研究と比べてどこがすごい?
- NNの更新などは一切なく,学習するパラメータは平均ベクトルと共分散行列の集合のみ
- kNNなどを使わないので,推論が高速
3. 技術や手法の"キモ"はどこ?
学習
- Pretrained modelから多重解像度な特徴Mapを抽出
- アップサンプリングして,1番空間解像度の大きい特徴Mapと空間解像度を揃えて,
のtensorにする - これらを次元ベクトルの個の集合と考え,訓練データ(正常のみ)から得られる特徴Mapに対して,position毎に平均ベクトルと共分散行列を求める
推論
- テストデータに対して,Pretrained modelから特徴Map抽出
- 学習で求めたpositino毎の平均ベクトルと共分散行列からマハラノビス距離を算出
4. どうやって有効だと検証した?
-
MVTec でSoTA
- 実際の外観検査に近づけるために,±10度のrandom rotaionを加えた
- にリサイズし,にセンタークロップ
-
特徴MapのチャンネルをPCAで次元削減したり,ランダム選択したりしても,精度に影響はなかった
5. 議論はあるか?
- 非常に単純な枠組みだが,SoTA
- MVTecの精度はほぼ限界なので,Beyond MVTec AD求む
- random rotationの影響を実験すべき