面向工业的图像分割深度学习技术研究和应用

来源 :深圳大学 | 被引量 : 0次 | 上传用户:yutianfeipao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度神经网络在图像处理领域取得了巨大的成功,并在图像分析和图像识别方面达到了最先进的性能。越来越多的深度学习方法从理论走向实践,在医疗,交通,教育,工业等各个领域有着广泛的应用价值。在工业生产上,工业产品表面缺陷检测环节对于保证产品的高质量和生产效率十分重要,并且需要在保证缺陷识别的准确率较高的前提下提高检测速度。卷积神经网络凭借其强大的特征提取能力,可对图像进行准确分析和识别,在工业缺陷检测中发挥着重要作用。工业生产环境相对较为复杂,因此设计出具有高精度和强鲁棒性的检测模型是本文的主要工作。本文主要设计出工业缺陷检测系统,并且对其进行改进,具体内容如下:1.提出了一种基于回归的通用工业缺陷检测框架。具体来说,该框架包含四个模块:基于深度回归的检测模块,像素级别过滤模块,连通域分析模块和缺陷分类模块。为了训练检测模块本文提出了一种高性能的回归网络和一种从标注数据中产生标签获取缺陷严重程度信息的算法。本论文已经在两个公共基准数据集Aigle RN,DAGM2007和一个真实工业电容数据集上测试了该方法。结果表明,本论文所提出的方法在检测精度,图像分割性能和速度方面有明显的优势。2.对所提出的工业缺陷检测框架进行改进。主要是设计出基于U-net结构的回归网络模块和加入抗锯齿处理的缺陷分类模块。为了更好的适应工业生产环境,结合U-net网络结构中的转置卷积,跳层结构等特点对缺陷回归模型进行改进,进而提高网络的图像分割性能。在缺陷分类上,主要针对图像平移不变性问题进行深入研究,将抗锯齿处理加入分类模型中,对卷积层和池化层等下采样操作进行相应的改进处理,提高模型的鲁棒性。相比之前的缺陷检测模型和当前流行的分割网络,改进后的模型在工业数据集上表现效果更好。
其他文献
随着半导体技术的不断更新,物联网、人工智能和5G通信等应用领域的不断发展以及电子产品功能的不断复杂化,对电源管理模块最大电流能力要求也不断增加。对于在电源管理类芯片中应用最广的低压差线性稳压器(Low Dropout Regulators,LDO),由于芯片封装大小以及散热的限制,使得单个LDO芯片能提供的最大电流也受到限制。而LDO的并联方案是解决该问题、提高电源系统最大电流能力的有效途径,但简
当前,中国人口老龄化问题日益突出,持续的老年人口增长将大众的视野聚焦到了老龄化相关的社会问题上,其中老年人的社会交往问题是重要问题之一。老年人退休后的社交圈子从社会工作转向了家庭邻里,社会联系的减少使得他们从心理上更需要与人交流,社会交往活动能够帮助老年人重新建立新的社会角色,构建新的社交网络,有利于老年人身心健康。住区户外活动空间是老年人群体进行日常交往活动的主要场所空间,其空间环境品质直接影响
随着快速城市化进程的推进,深圳市率先遇到了土地及空间资源约束的瓶颈,空间资源难以为继成为推进城市建设的主要障碍。与此同时,城市建设吸引的人口迁移、城市更新引发人口结构的变化以及教育政策的不断放宽将会对教育资源产生巨大的新增需求。现有教育设施难以满足激增的人口规模需求,导致教育设施的供需矛盾日趋凸显。在土地稀缺和人口增长的双重压力之下,城市更新成为空间资源获取的主要途径,通过城市更新完善教育设施配置
近年来随着人工智能的快速发展,自动问答系统备受瞩目且发展前景广阔。在生成式自动问答系统构建过程中,面临着由于知识匮乏而带来的生成不准确的问题。针对这个问题,本文将领域词典和知识图谱这两种不同形态的外部知识信息融合到深度模型中,增强对问句的理解,从而提高生成答案的准确性,研究内容如下:(1)针对生成式自动问答系统缺乏外部知识而导致的生成不准确问题,本文提出融合领域词典和拷贝机制的答案生成模型(LEP
图像风格迁移是指给定一组内容图像和风格图像,合成一张结果图像,该图像既保留内容图像的内容,又体现风格图像的艺术风格。图像风格迁移是计算机图形学、图像处理等领域的基础问题之一,在图像处理、艺术创作以及影视特效等方面有着广阔的应用前景。近几年里,随着深度学习的发展,虽然图像风格迁移方法的研究取得了重大进展,但是在实现图像任意风格迁移时,如何同时保证速度和图片质量,仍有待进一步解决。当今先进的图像任意风
在线投资组合选择的目标是在一组资产之间按某种比例分配资金,以最大化累积财富。现有的在线投资组合选择大多侧重于收益最大化,而缺乏有效地控制风险。并且许多风险控制算法使用最大回撤、夏普比率等作为风险指标对算法进行优化。但这些风险指标对短期内的风险并不敏感,往往会造成该类风险控制算法无法及时地控制短期风险,导致算法整体的风险控制效果不佳。针对上述问题,本文对在线投资组合的风险控制问题进行了如下研究:1)
近年来,越来越多的服务类机器人进入人们的生活。在人机共居的环境下,机器人既需要完成任务,又需要与人保持适当的距离,做到及时避让。传统的机器人避让方法,往往使用激光雷达、深度相机和传统的视觉处理算法,前两种方法成本过高,而传统的视觉处理算法会受光照等因素影响,并且过程也尤其繁琐。针对以上缺点,本文通过低成本单目相机,结合基于深度学习的深度估计与人体检测算法,仅用单张图片即可检测到人体,同时得到人体的
随着“儿童友好”理念的不断推行,儿童的需求和权利得到越来越多的关注。社区公园是与儿童生活最贴近的公共空间,也是城市公园系统的重要组成部分,承载了大部分儿童的日常户外活动,但目前社区公园的空间环境和各类设施还不能很好地满足儿童活动的需求,这对儿童户外活动的体验造成了较大的影响。与此同时,城市儿童肥胖率的不断上升给儿童的健康提出警告,儿童需要合适的、有吸引力的社区公园鼓励他们走出室内,进行户外活动来锻
文本摘要技术是自然语言处理(Natural language processing,NLP)领域中重要的一部分。近两年来,预训练语言模型在自然语言理解(Natural language understanding,NLU)任务中的成功应用,有力地推动了 NLP技术的发展进程。其中,以 BERT(Bidirectional encoder representation from transforme
近年来,随着云计算和大数据技术的发展,云存储服务器被广泛应用于人们的日常生活之中。用户可将大量数据上传到云存储服务器中。虽然云存储服务器向用户提供了认证服务,但是这并不能满足用户对安全存储的需求。加密技术是保证数据安全传输和存储的有效方法。在云计算超级计算能力的情况下,现有密码算法存在不足,因而适合云计算特性的密码算法是一个值得研究的问题,这对提高云存储数据的安全性具有重要意义。本文研究了云文件安