Vision Language | Nakatsuka Shunsuke

Segment Any Anomaly without Training via Hybrid Prompt Regularization

Vision Language Modelを使ってZeroshotの異常検知を行うモデル．GroundingDINO，Segment Anythingで異常領域の算出，面積・顕著性・スコアによるフィルタリング，クラス依存・非依存のプロンプトでWinCLIPよりも大幅に精度向上．