论文部分内容阅读
基于视觉的缺陷识别技术现已成为带钢表面质量控制的重要技术之一,其中特征提取方法的优劣直接影响其识别效果。本文通过分析了带钢表面缺陷的特点,采用了基于视觉词袋模型的框架对其进行特征提取与分类。针对现有的视觉词袋模型进行带钢表面缺陷识别时存在的问题,包括数据分布不均衡的问题、视觉单词的区分能力问题、缺乏对目标整体结构信息描述的问题、伪缺陷干扰的问题,进行了深入地分析并提出了相应的解决方案。具体研究内容如下:(1)为了检验特征提取方法的性能,建立了带钢表面缺陷图像数据集HG-steel和PSC-steel。其中,HG-steel是从邯郸钢铁集团生成线上采集得到的数据集,包含滴焦油、夹杂、表面麻点等10类缺陷,共2512幅图像。PSC-steel是从德国百思特标准库下得到的数据集,包含孔洞、边裂、水滴等16类缺陷,共2838幅图像。HG-steel与PSC-steel中的缺陷类别互不相同,可以有效实现数据集之间的互补,能全面地检验特征提取方法的性能。(2)针对数据分布不均衡的问题,提出了一种类别指导下的视觉码本生成方法。该方法通过在视觉词袋模型中的视觉码本生成阶段考虑缺陷类别的信息,提高视觉码本的区分能力和代表性,有效解决了数据集中样本数目少的类别识别率低的问题。为了验证方法的性能,分别在HG-steel和PSC-steel上进行了实验。本文算法这两个数据集上分别取得了97.72%和96.95%的识别率,说明本文提出的算法可以提高小样本缺陷类别的识别率,有效地降低了数据分布不均衡对缺陷分类性能带来的负面影响。(3)针对传统的视觉词袋模型未考虑视觉单词对缺陷表征能力不同的问题,提出了一种加权编码的缺陷图像特征表示方法。该方法在视觉词袋模型的特征表示阶段,通过利用视觉单词的词频和信息增益调整码本中视觉单词的权重。应用加权编码算法增加区分度高的视觉单词权重,减少区分度低的视觉单词权重,使得最终提取的图像特征更能有效区分各类缺陷之间的差别。本文算法与具有等权重的传统视觉词袋模型在HG-steel和PSC-steel上进行了实验对比,结果表明本文方法可以更好地对各类缺陷进行表示。(4)针对传统的视觉词袋模型缺乏对目标整体轮廓和结构信息描述的问题,提出了一种基于局部统计特征与全局结构特征融合的方法。在传统的视觉词袋模型中引入全局Gist特征实现与局部特征的互补。在缺陷图像数据集上进行了实验,并取得了更好的实验结果,有效验证了本文方法的有效性。(5)针对带钢表面背景图像中伪缺陷的干扰问题,本文通过高斯噪声模拟不同程度的伪缺陷,并评估了上述三种分类算法对噪声干扰的鲁棒性。实验结果表明,即使存在伪缺陷的干扰时,本文提出的方法都可以获得较好的分类性能。