基于生成对抗网络的工业产品表面缺陷数据增强方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:jiexp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度学习的目标检测算法因具有速度快、精度高等优点被工业产品表面缺陷检测领域寄予厚望。但该方法需要大量的缺陷数据用于模型训练,而工业场景中获取缺陷数据的成本往往较高,因此迫切需要有效的数据增强方法以降低缺陷数据的获取成本。和其他数据增强方法相比,基于生成对抗网络的数据增强方法因能生成更接近真实分布的数据而备受重视,所以本文基于生成对抗网络对缺陷数据增强方法中的若干典型问题展开了深入研究,具体研究内容如下:(1)面向工业产品表面小缺陷的图像生成方法DS-GAN:将无缺陷图像和有缺陷图像作为两种图像风格,进而通过对无缺陷图像进行风格迁移来生成有缺陷图像。pix2pix是一种优异的图像风格迁移框架,因此本文基于pix2pix实现缺陷图像增强。由于小缺陷在整个图像中占比较小而难以得到充分训练,所以pix2pix对包含小缺陷的图像处理效果不佳,为此本文对pix2pix做了两点优化:a)将包含缺陷的局部图像作为pix2pix判别器的输入使判别器更关注缺陷区域;b)基于包含缺陷的局部图像设计生成对抗损失,使网络更加关注缺陷区域特征的学习,从而实现生成缺陷质量的提升。实验表明,相较于pix2pix,利用本文方法生成的缺陷图像更加逼真,具有更低的FID,且能有效提升缺陷检测模型的精度。(2)工业产品表面缺陷图像的色调增强方法:由于材料配比变化等原因,同一类产品的不同个体的色调分布可能非常广泛,但因为所能收集的缺陷图像较少,所以缺陷图像难以涵盖所有色调分布,导致训练数据存在色调不均衡而影响模型的性能,因此需要对缺陷图像进行色调增强。虽然基于传统图像处理的数据增强方法能改变图像色调,但因缺乏参考而可能导致增强所得图像的色调分布与真实图像色调的分布不一致,所以有必要提供真实色调分布给增强算法作为参考。由于工业场景中容易获取涵盖所有色调分布的无缺陷图像,因此可利用大量无缺陷图像指导缺陷图像进行色调增强。基于上述观察,本文提出利用无缺陷图像进行色调建模的生成对抗网络HC-GAN,通过引入Content Consistency模块和Hue Controlled模块,实现了在不改变缺陷特征的前提下利用无缺陷图像指导缺陷图像进行色调转换的功能;在此基础上,设计了一个与HC-GAN串联的T-GAN,实现了缺陷位置可控的增强方法,进一步丰富了数据增强结果。实验结果表明,和工业界常用的将缺陷粘贴到无缺陷图像的方法以及基于DCGAN的数据增强方法相比,本文方法能够有效提升表面缺陷检测算法的精度。
其他文献
领域适应旨在解决传统机器学习方法依赖大量标记良好的训练数据以及领域偏移导致模型需要重新训练的问题,主要是利用一个相关的源领域来辅助目标域上的学习,通过最小化源域和目标域的分布差异,使在已标记的源域数据上训练的分类器能在无标记的目标域实例上取得满意的泛化效果。近年来,对抗学习被认为是学习域间不变特征的一种有效机制,对抗域自适应也成为了一种日益流行的领域适应方法。然而实际应用中影响领域适应性能的关键因
学位
随着移动通讯、物联网、航空航天等行业的不断发展,通信系统的集成度持续提高,对天线微型化设计的需求也随之增加。由于无线通讯设备的空间限制,一般要求天线具有较低的剖面高度。人工磁导体(Artificial Magnetic Conductor,AMC)在一定频段内具有同相反射的特性,可以取代理想电导体(Perfect Electric Conductor,PEC)作为天线反射板,有效降低天线剖面高度。
学位
随着遥感传感器技术的不断发展,高光谱图像分类成为目前研究的热点。由于在目前遥感传感器设计中,光谱分辨率与空间分辨率互相约束,无法兼得。因此,对于光谱分辨率较高的高光谱图像,空间分辨率往往很低,会导致混合像元的大量存在。从纯像元的角度考虑,混合像元会导致像元的光谱特征显著性降低,可分性减弱;从分类的角度考虑,纯像元地物与不同地物目标以不同比例混合,会导致类内松散,类间耦合。因此,混合像元导致同类别的
学位
作为图像理解的核心任务,目标检测是目标跟踪和实例分割等复杂视觉任务的基础。目标检测的任务就是识别图片或者视频中出现的预先设定好的目标物体类别并且返回目标的准确坐标位置和类别置信度。近年来,随着深度学习技术的发展和应用,研究人员们设计和实现了许多新的高效目标检测器。由于目标检测经常应用于诸如异常事件检测和汽车自动驾驶这样对实时性要求比较高的任务,单阶段目标检测器由于其较高的推理速度,成为了众多研究者
学位
随着信息技术的发展,网络中的图像数据量日益增长,图像已成为信息表达和传递的一个重要载体。如何从丰富的图像数据中自动地总结出其中的语义内容是当前机器学习领域关注的重点之一。基于深度学习的发展,图像描述任务取得了很大突破。但是目前大多数的研究工作关注的是为图像生成一个英文句子描述。事实上,世界上非英语母语者的人数众多,且图像描述任务不应该受限于某种特定的语言。因此,跨语言图像描述是一个值得探索的研究课
学位
深度强化学习作为人工智能领域的一个子领域,其能够使用简单的结构并且能够在不需要事先了解关于环境的知识的情况下解决广泛的任务,将强化学习融合多智能体系统形成的多智能体强化学习已经成为人工智能领域的研究热点。目前传统的多智能体深度强化学习由于联合状态空间庞大,动作行为的奖励稀少等原因导致每一个智能体在训练前期难以获得奖励、收敛速度慢、智能体之间难以形成有效配合。而且深度强化学习往往只针对连续或者离散动
学位
近年来,面向多标签分类的特征选择技术受到越来越多的关注和应用。然而,一方面,已有的多标签特征选择方法大多未考虑所选特征的全局最优性以及多标签数据中标签冗余的问题,导致多标签学习模型的性能下降。另一方面,这些方法大多忽略流特征的场景,而考虑流特征的多标签流特征选择方法又忽略了多标签的类不平衡问题。针对上述问题,本文围绕多标签特征选择开展研究,主要研究工作包括:(1)针对标签冗余和全局最优性,提出一种
学位
为了缓解互联网环境下愈发严峻的信息过载问题,个性化推荐成为众多大型系统必不可少的模块,通过背后的推荐算法挖掘交互历史中隐藏的用户兴趣,为用户推荐与其最匹配的物品。然而,很多推荐算法对交互数据的高度依赖性导致其难以应对交互稀疏或冷启动等问题。本文认为推荐系统中许多图结构的数据,可以从多个角度为推荐向量的学习过程注入辅助信息,进而缓解交互不足引发的推荐效果下降问题。为此本文对多种图结构数据进行研究,重
学位
因果关系能够刻画事件的本质关联,对于理解数据、解释事件有着重要意义。因果关系的获取主要有两种:一种是分析观察数据获取各属性间的因果关系,另一种是分析文本数据提取其中陈述的因果关系。前者面临某些因果关系无法单纯从数据区分的问题,而后者面临文本蕴含的因果知识有限的问题。考虑健康领域拥有丰富的专业文献和大量公开的观察数据集,因此本文面向健康领域,创新性地探索观察数据与文本数据相结合的因果关系图构建方法,
学位
复杂社交网络(CSG)因其蕴含丰富上下文信息已经成为众多学者的研究对象。通过设计含多属性需求的模式图,图模式匹配得以有效利用该丰富信息因而在CSG领域得到广泛应用。然而,随着决策问题日益复杂、决策者(Decision Makers,DMs)数量增多,模式图复杂性也不断增加:不同决策者对模式图中各属性常有不同需求。因而如何聚合各需求得到满足决策者偏好的模式图为多约束图模式匹配问题带来了新挑战。本文旨
学位