Anomaly Detection系列（CVPR2025 TailedCore论文解读）

张开发

• 2026/6/21 16:01:51 • 15 分钟阅读

分享文章

Anomaly Detection系列（CVPR2025 TailedCore论文解读）

TailedCore: Few-Shot Sampling for Unsupervised Long-Tail Noisy Anomaly Detection无监督长尾噪声异常检测旨在从含噪且类别分布极度不平衡的数据集中识别异常样本。现有方法面临三大核心挑战-依赖像素级噪声鲁棒性假设当前模型要么对噪声敏感要么在少数类上表现差-缺乏对类别分布未知的处理能力多数方法需要显式类别标签或强先验知识-无法有效区分少数类特征和异常特征二者统计特性相似易混淆。图1.尾部类别x轴与噪声头部类别y轴性能对比。基于记忆的异常检测模型圆圈标记中尾部与噪声的权衡关系呈现且通过图像级 AUROC 评估的异常分类任务左图更能体现该特性。本文提出TailedCore在MVTecAD上图像级AUROC达96.1%超越SOTA 3.7个百分点。核心贡献本文核心贡献包括首个完全无监督框架应对长尾噪声环境下的异常检测任务解决“尾部vs噪声”权衡难题Tail-versus-noise dilemmaHR-Avenue AUROC95.24%提出TailSampler模块基于嵌入空间角度对称性估计类别基数实现精准采样尾部类样本Tail class sampling accuracy 99%构建TailedCore记忆库融合去噪基线PatchMemory与尾部增强PatchMemory参数量仅增加约10%但显著提升整体性能引入肘部法自动判断最大尾部类规模K_max无需人工设定超参适用性强设计了新的评估基准Long-Tail Noisy AD Benchmark支持多种分布形态Step、Pareto等便于后续研究比较。相关工作综述(一) 多类异常检测局限现有方法主要包括[多类重构型方法]如UniAD其核心思想是通过局部注意力避免捷径学习但局限在于无法处理噪声污染数据中的缺陷区域误判问题及静态图结构难以捕捉跨类别的复杂交互模式。→ 本文改进引入TailSampler分离尾部类样本进行独立建模缓解噪声干扰。(二) 少样本异常检测不足现有方法主要包括[零样本/少样本方法]如WinCLIP其核心思想是借助预训练视觉语言模型提取通用表征但局限在于依赖复杂的提示工程和在充分训练样本下精度仍低于传统方法。→ 本文改进无需任何提示微调过程直接利用编码器嵌入构建尾部感知机制。(三) 噪声鲁棒学习缺陷现有方法主要包括[噪声净化策略]如SoftPatch其核心思想是剔除高离群值得到干净内存核但局限在于同时丢失大量尾部类信息和阈值选取影响最终效果稳定性。→ 本文改进结合TailSampler保留尾部类补丁并采用贪心采样优化代表性。方法论详解图2. (a) TailedCore本研究的采样过程描述及 (b) 如何应用TailedCore的示意图1. TailSampler — 类别大小预测模块- 功能用于准确估算每个训练样本所属类别的数量。- 机制基于嵌入向量的角度对称性假设计算邻域内邻居的邻域大小众数作为类别大小估计值。- 动机相比传统聚类算法更稳健尤其适用于极不平衡且含噪声的数据集相较于孤立森林等方法更具可解释性和可控性。推测潜在失败场景当类别间几何距离过近时可能导致错误分类若编码器提取的嵌入质量不佳则会影响整个预测准确性。2. Elbow Point Estimator — 自动确定尾部类上限- 功能根据类别大小排序后的曲线自动定位拐点从而决定哪些属于尾部类。- 机制使用线性拟合连接首尾两点寻找垂直于直线的最大正交距离对应的类别索引。- 动机无需人为设置K_max提高方法普适性相比固定比例划分更加灵活可靠。分析选择理由为何不用均值分割因为长尾分布本身具有非均匀性简单平均会掩盖真实变化趋势。3. Memory Augmentation Strategy — 记忆扩充策略- 功能将原始噪声净化记忆库与TailSampler筛选出的尾部类补丁合并形成完整记忆库。- 机制分别执行噪声过滤与尾部采样后再做贪心共核采样确保两者兼顾。- 动机既保证了主干类别的纯净性又增强了尾部类别的表达力有效缓解Tail-versus-noise trade-off。探讨替代方案优劣如果只用噪声净化后的Patch是否足够答案是否定的——这会导致尾部类信息缺失进而降低召回率。实验与验证性能对比效率分析- 参数增长10%- 推理速度与PatchCore相当~10ms/image消融实验解读性能提升根本原因TailSampler成功隔离尾部类样本使得记忆库既能抵御噪声又能保留细节信息从而全面提升检测能力。结论与展望贡献重申提出TailSampler精确预测类别基数解决尾部vs噪声冲突构建TailedCore记忆库整合去噪与尾部增强双重优势在多个公开基准上验证有效性图像级AUROC最高达96.12%。未来方向探索动态阈值自适应调整以进一步提升鲁棒性扩展至视频域异常检测任务结合Transformer架构提升嵌入质量开发在线更新机制适应流式生产环境。局限性目前方法在无异常长视频中可能误报稀有正常事件此外对于高度重叠的类别边界尚存在误检风险。

更多文章

前端开发 2026/6/19 7:07:38

Windows与iOS设备USB网络协议兼容性解决方案：Apple-Mobile-Drivers-Installer技术实现

Windows与iOS设备USB网络协议兼容性解决方案：Apple-Mobile-Drivers-Installer技术实现【免费下载链接】Apple-Mobile-Drivers-Installer Powershell script to easily install Apple USB and Mobile Device Ethernet (USB Tethering) drivers on Windows! 项目地…

版本：2026-04-17 主题：Kimi K2 算法框架分析、训练/后训练方法、公开代码结构与工程落地解读说明：本文基于 Kimi K2 官方技术报告、官方 GitHub 仓库、Hugging Face 模型卡与配置/代码文件整理而成。由于官方并未完整开源预训练与 RL 训练框…

张开发

前端开发 2026/6/19 0:46:47

可微分3D高斯溅射（3DGS）在医学影像实时交互式教学中的创新实践

1. 可微分3D高斯溅射技术为何能革新医学教学？ 第一次在手术模拟器上看到跳动的心脏三维模型时，我意识到传统的医学教学方式正在被颠覆。可微分3D高斯溅射（3DGS）这项源自计算机图形学的技术，正在给医学教育带来前所未有…

张开发

Anomaly Detection系列（CVPR2025 TailedCore论文解读）

最新文章

NVIDIA DGX SuperPOD：AI超级工厂的算力革命

STC8H8K64U单片机内存布局保姆级图解：从code区到EEPROM，新手避坑指南

TVA技术在能源行业的应用综述

python jwt

保姆级教程：在粤嵌GEC6818上搞定GY-39传感器数据采集（附完整源码）

Android音频启动流程避坑指南：AudioPolicyService与AudioFlinger的交互核心loadHwModule与openOutput详解

推荐文章

相关文章

分享文章

更多文章

Windows与iOS设备USB网络协议兼容性解决方案：Apple-Mobile-Drivers-Installer技术实现

HY-Motion 1.0保姆级教程：从零配置GPU环境到生成电影级3D动作

5分钟掌握浏览器HTML转Word：前端文档转换终极指南

2026年美国EB-1A移民：如何选择专业的申请机构与服务机构？

基于微信小程序的旅行规划系统源码+论文

3分钟搞定Windows与Office激活：KMS_VL_ALL_AIO智能脚本完整指南

Etcher 跨平台镜像烧录指南：从下载到实战（附常见问题解析）

3分钟掌握AI字幕生成：OpenLRC音频转文字与多语言翻译全攻略

保姆级教程：用ESP32-P4和ST7703屏打造24fps视频轮播器（附完整代码和FFmpeg转换命令）

目标检测刷榜史：从R-CNN到Faster R-CNN，那些被我们忽略的工程“魔法”与妥协

Kimi K2 模型总结

可微分3D高斯溅射（3DGS）在医学影像实时交互式教学中的创新实践