China
  • 021-57675563

当前位置:知识中心 / 轩田技术篇 /

专家说丨AI工业瑕疵检测技术:原理与应用

发布时间:2024-07-16    浏览人数:1人查看

在上一篇文章中,我们探讨了智能化变革如何通过AI技术重塑工业瑕疵检测的整体框架。这一篇,我们将深入解析AI在工业瑕疵检  测中的具体技术应用,详细介绍常用的框架和算法原理。通过了解这些核心技术,可以更全面地掌握如何利用AI提升工业生产的质量控制效率,并在实际应用中充分发挥其潜力。


image


有监督学习和无监督学习


在基于深度学习的工业瑕疵检测中,有监督学习和无监督学习是两种主要的方法。有监督学习依赖于标注的瑕疵数据进行训练,能够提供高精度的检测结果。常见的方法包括最新的 Vision Transformers (ViTs) 和 YOLO系列。这些模型能够高效地处理复杂的图像数据,并实现精确的瑕疵检测,例如在高精密制造业中用于检测电子元件的微小缺陷。这些缺陷可能包括细小的裂纹、焊接不良或表面不平整,使用有监督学习能够显著提高检测的准确性和效率。


无监督学习则不需要标注数据,主要通过学习正常样本特征来检测异常,适用于未知瑕疵的发现。常见的方法有 PaDiM (Patch Distribution Modeling) 和 PatchCore。这些方法通过分析正常样本的统计特性来识别异常区域,对于未知类型的瑕疵有很好的适应性。例如,在自动化生产线上,PaDiM 和 PatchCore 可以检测出以前未见过的产品缺陷,如新出现的表面划痕、材料老化或意外污染等。无监督学习方法在处理多变和复杂的工业环境时具有显著优势。


image


此外,结合有监督学习和无监督学习的方法也逐渐成为趋势。通过无监督学习进行初步筛选,然后使用有监督学习进行精细分类和定位,可以提高检测系统的整体性能。例如,先使用 PaDiM 模型检测可能的异常区域,然后利用 ViTs 对这些区域进行精确分类和分析。这种结合的方法不仅提高了检测精度,还能有效应对多样化和复杂的瑕疵检测需求,提升工业检测系统的智能化水平。


无监督异常检测算法框架Anomalib


image


Anomalib是一个新兴的开源异常检测框架,专门为工业缺陷检测和其他异常检测任务设计,主要专注于无监督和弱监督的异常检测方法,其中收集了最先进的异常检测算法,例如PaDiM、PatchCore、CFlow-AD等等。不仅如此,Anomalib还提供了便捷的 API 和丰富的文档,便于研究人员和工程师进行自定义开发。


PaDiM 利用预训练的特征提取器,结合多尺度特征进行异常检测;PatchCore 通过对图像的局部特征进行建模,利用核心集选择减少计算量,提高检测效率;CFlow-AD 则采用条件流模型,联合学习图像特征和流分布,提高检测精度,并支持端到端训练。这些算法在工业瑕疵检测中展现了各自的优势,适用于不同的应用场景。




基于ViT的工业异常检测


image


基于 Vision Transformer (ViT) 的工业异常检测算法利用了 Transformer 架构在图像特征提取方面的强大能力。ViT 将输入图像分割成固定大小的图像块,并通过 Transformer 编码器进行处理,从而捕捉到图像中的长距离依赖关系和复杂特征。这使得 ViT 在检测各种工业表面缺陷时,能够提供高精度和高鲁棒性的检测结果。通过使用大规模数据集(如 ImageNet)对 ViT 模型进行预训练,获得强大的特征提取能力,然后通过工业表面缺陷数据集进行微调,使其适应特定的检测任务,能够高效地识别偏离正常分布的异常样本。


基于 ViT 的工业异常检测算法具有高精度特征提取、灵活性强和良好的泛化能力等优势。它可以处理各种规模和类型的工业图像,适用于不同的工业检测任务,如表面缺陷检测、产品质量控制和设备监控等。随着深度学习技术的发展,ViT 在工业异常检测中的应用前景广阔,能够显著提升工业检测的智能化水平。




基于YOLO的工业异常检测


image


YOLO 模型将目标检测问题转换为单一回归问题,通过一次前向传播就能同时预测多个边界框和类别概率,使其能够在高帧率下处理图像并检测出工业表面的各种缺陷,如裂纹、划痕和异物。其速度和精度的平衡使得 YOLO 特别适用于工业生产线上的实时监控和快速反应场景。


在实际应用中,YOLO 模型先在大规模通用数据集上进行预训练,获得强大的特征提取能力,然后在具体的工业异常数据集上进行微调,以适应特定的检测任务。这种方法不仅提高了检测的精度和鲁棒性,还能处理多种规模和类型的工业图像。基于 YOLO 的工业异常检测算法因其高效性、灵活性和良好的泛化能力,被广泛应用于自动化生产线、产品质量控制和设备故障检测等领域。



基于VLM的工业异常检测


image



随着视觉语言模型(VLM)的发展,工业异常检测利用视觉和语言的多模态特征融合,能够更准确地识别和描述异常。VLM 同时处理图像和文本信息,捕捉丰富的上下文和特征,在检测复杂工业表面缺陷时提供精确的识别和详细的描述,提高了检测结果的可解释性。


应用中,VLM 先用大规模多模态数据集预训练,再通过工业异常数据集微调,使其适应特定检测任务。该算法具有高精度、多模态融合和良好的泛化能力,适用于制造缺陷识别、产品质量监控和设备状态评估等任务。随着多模态学习技术的发展,VLM 有望显著提升工业检测的智能化水平和效率,推动更高效、更智能的工业检测系统的发展。



参考文献

[1] Defard, T., Setkov, A., Loesch, A., & Audigier, R. (2020). PaDiM: A Patch Distribution Modeling Framework for Anomaly Detection and Localization (arXiv:2011.08785). arXiv. https://doi.org/10.48550/arXiv.2011.08785

[2] Roth, K., Pemula, L., Zepeda, J., Scholkopf, B., Brox, T., & Gehler, P. (2022). Towards Total Recall in Industrial Anomaly Detection. 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 14298–14308.

[3] Zhu, J., & Pang, G. (2024). Toward Generalist Anomaly Detection via In-context Residual Learning with Few-shot Sample Prompts (arXiv:2403.06495). arXiv. https://doi.org/10.48550/arXiv.2403.06495


部分图片来源于网络,如有侵权,联系删除。