Anomaly Detection系列(CVPR2025 TailedCore论文解读)

张开发
2026/4/17 19:18:39 15 分钟阅读

分享文章

Anomaly Detection系列(CVPR2025 TailedCore论文解读)
TailedCore: Few-Shot Sampling for Unsupervised Long-Tail Noisy Anomaly Detection无监督长尾噪声异常检测旨在从含噪且类别分布极度不平衡的数据集中识别异常样本。现有方法面临三大核心挑战-依赖像素级噪声鲁棒性假设当前模型要么对噪声敏感要么在少数类上表现差-缺乏对类别分布未知的处理能力多数方法需要显式类别标签或强先验知识-无法有效区分少数类特征和异常特征二者统计特性相似易混淆。图1.尾部类别x轴与噪声头部类别y轴性能对比。基于记忆的异常检测模型圆圈标记中尾部与噪声的权衡关系呈现且通过图像级 AUROC 评估的异常分类任务左图更能体现该特性。本文提出TailedCore在MVTecAD上图像级AUROC达96.1%超越SOTA 3.7个百分点。核心贡献本文核心贡献包括首个完全无监督框架应对长尾噪声环境下的异常检测任务解决“尾部vs噪声”权衡难题Tail-versus-noise dilemmaHR-Avenue AUROC95.24%提出TailSampler模块基于嵌入空间角度对称性估计类别基数实现精准采样尾部类样本Tail class sampling accuracy 99%构建TailedCore记忆库融合去噪基线PatchMemory与尾部增强PatchMemory参数量仅增加约10%但显著提升整体性能引入肘部法自动判断最大尾部类规模K_max无需人工设定超参适用性强设计了新的评估基准Long-Tail Noisy AD Benchmark支持多种分布形态Step、Pareto等便于后续研究比较。相关工作综述(一) 多类异常检测局限现有方法主要包括[多类重构型方法]如UniAD其核心思想是通过局部注意力避免捷径学习但局限在于无法处理噪声污染数据中的缺陷区域误判问题 及 静态图结构难以捕捉跨类别的复杂交互模式。→ 本文改进引入TailSampler分离尾部类样本进行独立建模缓解噪声干扰。(二) 少样本异常检测不足现有方法主要包括[零样本/少样本方法]如WinCLIP其核心思想是借助预训练视觉语言模型提取通用表征但局限在于依赖复杂的提示工程和 在充分训练样本下精度仍低于传统方法。→ 本文改进无需任何提示微调过程直接利用编码器嵌入构建尾部感知机制。(三) 噪声鲁棒学习缺陷现有方法主要包括[噪声净化策略]如SoftPatch其核心思想是剔除高离群值得到干净内存核但局限在于同时丢失大量尾部类信息 和 阈值选取影响最终效果稳定性。→ 本文改进结合TailSampler保留尾部类补丁并采用贪心采样优化代表性。方法论详解图2. (a) TailedCore本研究的采样过程描述及 (b) 如何应用TailedCore的示意图1. TailSampler — 类别大小预测模块- 功能用于准确估算每个训练样本所属类别的数量。- 机制基于嵌入向量的角度对称性假设计算邻域内邻居的邻域大小众数作为类别大小估计值。- 动机相比传统聚类算法更稳健尤其适用于极不平衡且含噪声的数据集相较于孤立森林等方法更具可解释性和可控性。推测潜在失败场景当类别间几何距离过近时可能导致错误分类若编码器提取的嵌入质量不佳则会影响整个预测准确性。2. Elbow Point Estimator — 自动确定尾部类上限- 功能根据类别大小排序后的曲线自动定位拐点从而决定哪些属于尾部类。- 机制使用线性拟合连接首尾两点寻找垂直于直线的最大正交距离对应的类别索引。- 动机无需人为设置K_max提高方法普适性相比固定比例划分更加灵活可靠。分析选择理由为何不用均值分割因为长尾分布本身具有非均匀性简单平均会掩盖真实变化趋势。3. Memory Augmentation Strategy — 记忆扩充策略- 功能将原始噪声净化记忆库与TailSampler筛选出的尾部类补丁合并形成完整记忆库。- 机制分别执行噪声过滤与尾部采样后再做贪心共核采样确保两者兼顾。- 动机既保证了主干类别的纯净性又增强了尾部类别的表达力有效缓解Tail-versus-noise trade-off。探讨替代方案优劣如果只用噪声净化后的Patch是否足够答案是否定的——这会导致尾部类信息缺失进而降低召回率。实验与验证性能对比效率分析- 参数增长10%- 推理速度与PatchCore相当~10ms/image消融实验解读性能提升根本原因TailSampler成功隔离尾部类样本使得记忆库既能抵御噪声又能保留细节信息从而全面提升检测能力。结论与展望贡献重申提出TailSampler精确预测类别基数解决尾部vs噪声冲突构建TailedCore记忆库整合去噪与尾部增强双重优势在多个公开基准上验证有效性图像级AUROC最高达96.12%。未来方向探索动态阈值自适应调整以进一步提升鲁棒性扩展至视频域异常检测任务结合Transformer架构提升嵌入质量开发在线更新机制适应流式生产环境。局限性目前方法在无异常长视频中可能误报稀有正常事件此外对于高度重叠的类别边界尚存在误检风险。

更多文章