基于深度学习的织物瑕疵检测算法研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:truebyb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在纺织工业中,由于织机的机械故障、机器部件老旧、用于编织的纱线存在缺陷、布匹被过度拉伸或者表面存在褶皱等原因,加工出来的织物表面往往存在大大小小的瑕疵,严重影响到纺织工厂的生产效益。因此织物瑕疵检测成为纺织工业质量控制的重要环节。为了满足织物瑕疵检测模型需要具备高检测速度、高检测精度、低人工成本的实际需求,本文将深度学习方法应用到织物瑕疵检测领域中,研究并设计出适用于多种瑕疵类型与复杂纹理背景图像的织物瑕疵检测算法。本文的主要工作与贡献总结如下:(1)结合自底向上路径增强结构的RefineDet织物瑕疵检测算法。为了实现快速、高效地定位织物图像上的瑕疵目标,使用强大的单阶段目标检测模型RefineDet作为基本网络架构,在网络头部结构设计并添加了自底向上的路径增强结构用以实现融合浅层结构特征与深层语义特征的功能,增加模型的“路径聚合”能力。此外,模型在图像预处理阶段、网络设计阶段以及后处理阶段分别结合Mosaic数据增强方法、通道注意力机制、DIoU-NMS等通用的优化方法与组件,研究并验证了这些最新的通用优化方法在织物瑕疵检测上的性能,为同领域的研究人员提供重要的参考。这种结合自底向上路径增强结构的RefineDet织物瑕疵检测算法能够在不影响模型高速检测的前提下,有效地提升了瑕疵检测精度。在公有的织物瑕疵检测数据集TILDA数据集、香港周期纹理数据库以及DAGM2007数据集上,所提方法的检测精度优于其他常见的目标检测模型。(2)基于深度卷积残差网络与类激活映射机制的弱监督织物瑕疵检测算法。为了满足织物瑕疵检测模型需要具备低人工成本的需求,设计了一种强大的弱监督织物瑕疵检测算法。首先,使用深度卷积残差网络ResNet-50作为特征提取网络,替代VGG-16与InceptionV3模型来训练更强大的织物图像分类模型。其次,在测试阶段使用类激活映射机制直接生成待检图像在各个瑕疵类别的得分图。然后,对得分图进行二值化、连通域分割,生成目标连通区域的预测框,得到最后的弱监督瑕疵目标定位结果。在训练过程中只使用到图像级别的标注,就可以在测试阶段直接完成目标定位任务,所提方法能够大大减少训练模型所需的人工标注成本,具有广阔的实际应用前景。
其他文献
随着多媒体技术和计算机视觉的不断发展,立体图像的视觉效果使其得到广泛关注。相较于二维图像的平面感,立体图像带给人们的是更加真实和自然的视觉体验。由于图像采集过程受各种因素影响,不同视点下拍摄的相同物体的亮度和色度可能发生变化,导致立体图像左右视图之间产生颜色或亮度差异,这种差异会影响深度信息重建,进而使观众感到视觉疲劳。为了解决现有颜色校正方法中校正效果与时间效率不平衡问题,本文主要研究基于卷积神
学位
人群计数是指对人群图片中的人数进行估计,人群定位是指对人群图片中每一个人在图片中的位置进行精确定位。近些年,基于密度图和深度学习的人群计数发展迅速,成为当前人群行为研究的主要研究方向之一。但目前大部分研究侧重于对网络结构进行改进,缺少对密度图生成方法的研究。对此,本文提出了一种新的密度图生成方法,可以生成质量较好的密度图,使一个轻量的人群计数框架在不同拥挤程度的人群场景中达到领先的人群计数性能;且
学位
伴随着人工智能的兴起,越来越多人开始关注深度网络。通常,需要使用大量的数据样本对深度网络模型进行训练,才能得到较好的分类效果,但是很多应用场景中都无法获取足够的样本数量。为了解决样本数量匮乏的问题,专家学者们提出了少样本学习的概念。图像分类中的少样本学习的目标是在每类标记样本较少的情况下,对未标记图像进行正确的分类。目前基于度量的少样本学习算法在图像分类任务上已经获得很优异的性能。这类算法首先获得
学位
超大规模集成电路布线阶段是集成电路设计(IC设计)中的核心步骤,用于确定芯片中各个引脚的具体走线,对芯片最后的性能、功耗有着重大影响。超大规模集成电路布线问题是一个NP-hard问题。集成电路的集成规模不断扩大,问题逐渐复杂化,设计一个高效的布线算法难度也越来越大。布线设计一般采用两阶段布线设计,先全局粗化布线再局部细化布线。本文聚焦于全局布线问题的研究上,从2D和3D两个维度,分别提出了解决办法
学位
深度神经网络已广泛应用于各领域,成功解决了诸多复杂的任务,而深度网络的高效训练是其成功的关键之一。然而,由于相关理论基础薄弱,现有的网络训练方法仍存在诸多亟待解决的问题,这些问题严重阻碍了深度网络的进一步推广。随着技术的进一步发展,一方面网络训练中易于发现的诸如梯度消失等问题已经有一些较为成熟的解决方法,但另一方面也存在理论上会影响训练结果却又难以验证及解决的问题。内协变量漂移(internal
学位
随着集成电路规模不断扩大,时延显著增大并因此对芯片性能造成严重的负面影响。作为超大规模集成电路物理设计中的关键环节,层分配在决定布线方案的时延方面具有重要作用。同时,随着超大规模集成电路工艺发展,先进制程已引起了诸多领域的关注。在先进制程技术中,非默认规则线和通孔柱两项技术分别在优化导线时延和通孔时延方面具有可观的潜力。因此,将非默认规则线和通孔柱相结合可以构成一个相对完整的基于先进制程的线网时延
学位
影像记录设备拍摄得到图像,其尺寸大小一般由其设备参数决定,当用户需要将这种统一尺寸图像在不同尺寸显示设备下投放时,通常发生图像被挤压变形或者不完全显示,严重影响到图像传递信息的准确性和视觉展示的友好性。图像重定向是一种旨在处理图像与屏幕尺寸不适配的图像处理技术,因此,对于以上现实常见需求场景,图像重定向是一个不可或缺的图像处理环节。本文研究了经典和基于深度学习的重定向方法,首先对经典重定向方法中重
学位
辅助驾驶系统(Advanced Driver Assistance Systems,ADAS)是智能交通系统的重要组成部分,其基础算法模块包括车道线检测、跟踪和车前障碍物目标识别等。现有的基于嵌入式平台的辅助驾驶系统由于计算资源受限,尚不能满足实时性和准确性的要求。本文针对扬州市人工智能研究院的实际课题,以面向嵌入式平台的辅助驾驶系统作为研究对象,采用NVIDIA Jetson TX2作为计算平台
学位
复杂事物间的关联通常采用网络进行表示,随着网络规模的增长,事物的联系以大规模复杂网络的形式呈现出来,并行图计算就是将大规模复杂网络抽象成图再以并行的方式进行分析,通常采用图分区和图通信迭代技术。图分区是将图数据划分至不同的分区上;通信迭代的实现依赖于分布式图计算模型,在模型上执行图算法时需要多轮迭代,图上顶点之间会进行消息通信,是一种通信迭代过程。通信迭代时,每个顶点每次只传输一个消息的为单一的通
学位
多模态摘要旨在从文本、图像等不同的模态中精炼显著信息,并通过一种概括性描述来表示,近年来得到了国内外研究人员的广泛关注。目前的研究工作主要采用深度学习的方法,取得了瞩目的成果。但仍然存在一些问题:难以有效捕获图像中的关键目标特征;现有模型中需要优化的网络参数较多,导致训练时间较长;缺乏对图像内部噪声的屏蔽能力,导致模型难以准确刻画图像表示。本文针对上述问题展开研究,具体研究内容可分为以下三个方面:
学位