以下文章来源于微信公众号:我爱计算机视觉
作者:小张Tt
链接:https://mp.weixin.qq.com/s/_mJKn4o_U_VjEqlz7DXUFQ
本文仅用于学术分享,如有侵权,请联系后台作删文处理
Winning Solution for the CVPR2023 Visual Anomaly and Novelty Detection Challenge: Multimodal Prompting for Data-centric Anomaly Detection
。-
作者:Yunkang Cao ;Xiaohao Xu ;Chen Sun等人 -
作者机构:State Key Laboratory of Digital Manufacturing Equipment and Technology(数字化制造装备与技术国家重点实验室);Huazhong University of Science and Technology, China(华中科技大学)等 -
论文链接:https://arxiv.org/pdf/2306.09067.pdf -
项目链接:https://github.com/caoyunkang/Segment-Any-Anomaly
本报告介绍了团队 Segment Any Anomaly
在 CVPR2023 视觉异常与新奇检测挑战赛中的获胜解决方案。该解决方案名为Segment Any Anomaly +(SAA+)
,通过使用多模态提示实现了零样本异常分割,以及级联现代基础模型的正则化。首先,通过将基础模型如”Segment Anything”进行组合(SAA),利用多模态先前知识实现异常定位。随后,引入多模态提示(SAA+),这些提示来自领域专家知识和目标图像上下文,从而使基础模型在异常分割中能够进行非参数适应。
所提出的SAA+模型在零样本设置下,在多个异常分割基准数据集上(包括VisA和MVTec-AD)取得了最先进的性能
1 引言
本文介绍了在零样本异常分割领域的研究工作。通过使用基础模型、语言提示和分割方法,作者旨在在图像中进行异常分割。然而,简单的语言提示可能会导致误报问题,而且在领域转移和上下文不明确的情况下表现不佳。为了解决这些问题,作者提出了一种新的框架——Segment Any Anomaly +(SAA+),其中融合了领域专家知识和目标图像上下文。专家知识提供了与目标相关的异常详细描述,而上下文提示能够准确地关联目标图像中的物体上下文和异常预测。这一方法在多个异常分割基准数据集上取得了最先进的性能。总之,通过引入专家知识和目标上下文,作者的方法在零样本异常分割任务中取得了显著的改进。
2 从纯粹的基础模型组合开始,带有语言提示
3 利用多模态提示调适基础模型进行异常分割
3.1 从领域专家知识生成的提示
3.2 从目标图像上下文中衍生的提示
4 实验
4.1 实验设置
4.2 主要结果
4.3 消融实验
5 结论
6推荐阅读
AIHIA | AI人才创新发展联盟2023年盟友招募
AIHIA | AI人才创新发展联盟2023年盟友招募
AI融资 | 智能物联网公司阿加犀获得高通5000W融资
AI融资 | 智能物联网公司阿加犀获得高通5000W融资
Yolov5应用 | 家庭安防告警系统全流程及代码讲解
江大白 | 这些年从0转行AI行业的一些感悟
Yolov5应用 | 家庭安防告警系统全流程及代码讲解
江大白 | 这些年从0转行AI行业的一些感悟
《AI未来星球》陪伴你在AI行业成长的社群,各项福利重磅开放:
(1)198元《31节课入门人工智能》视频课程;
(2)大白花费近万元购买的各类数据集;
(3)每月自习活动,每月17日星球会员日,各类奖品送不停;
(4)加入《AI未来星球》内部微信群;
还有各类直播时分享的文件、研究报告,一起扫码加入吧!
大家一起加油!
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...