Vision Language

Segment Any Anomaly without Training via Hybrid Prompt Regularization

Vision Language Modelを使ってZeroshotの異常検知を行うモデル.GroundingDINO,Segment Anythingで異常領域の算出,面積・顕著性・スコアによるフィルタリング,クラス依存・非依存のプロンプトでWinCLIPよりも大幅に精度向上.