基于深度学习的金属表面凹凸字符纹理细节增强及识别算法研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:hqxt2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
金属凹凸字符以耐高温、耐磨损、不易被篡改伪造的特性在制造业中被广泛用来记录重要信息,但由于在生产制造环境中采集的金属表面凹凸字符图像通常存在曝光不均匀的现象,加上字符文本行排版不规则、字符与其背景之间的对比度较低等因素,使得从金属表面凹凸字符图像中提取文本信息、并进行准确识别的难度极高。本研究将图像处理技术和计算机视觉技术相结合应用于制造业解决金属制品表面凹凸字符的自动化识别问题,提升金属凹凸字符识别的准确率,可以提高生产制造和使用管理过程中的智能化水平,有助于实现制造业向智能化转型升级。主要研究内容和结论如下:首先,设计了一个四方向光源双重曝光图像采集系统,采集分别从四个方向打光的双重曝光图像序列,这样的金属凹凸字符图像序列包含不同的细节特征信息。提出了一种四方向双重曝光细节增强的图像融合方法,对采集的图像序列以亮度、局部对比度和饱和度三个权重项为衡量因子构建精确权值图,同时使用加权引导滤波从短曝光图像序列提取包含丰富纹理信息的细节特征图,将精确权值图和细节特征图进行加权融合得到曝光均匀且细节特征增强的融合结果,为后续的金属凹凸字符文本行准确定位和识别提供高质量的图像。然后,改进了一种基于文本行分割的金属凹凸字符检测算法,对融合后的图像进行金属凹凸字符文本行定位。该算法包含特征提取网络、特征融合网络、循环纵横交错注意力模块(RCCA)和后处理模块。以Resnet18为特征提取网络,在特征提取时采用可变形卷积增大感受野,利用金字塔特征融合网络进行多尺度特征融合,加入循环纵横交错注意力模块,使算法更关注金属凹凸字符图像中像素点的长距离相关性,提升对字符间隔距离不一致的不规则文本行的检测定位效果,后处理模块引入了可微二值化,提高了后处理的计算效率,加快梯度回传更新权值,有利于模型的最终收敛。实验验证表明,本研究改进的检测算法准确率为95.2%,在金属表面凹凸字符的检测定位中有较强的鲁棒性。最后,提出了一种纹理细节增强的金属凹凸字符识别算法,该网络包含金属凹凸字符纹理细节增强模块和字符识别模块两部分。首先利用识别模块的文本感知损失函数来加强基于pix2pix的图像翻译网络对文本内容的关注,从而生成金属凹凸字符纹理细节显著性增强的图像,再由具有矫正作用的基于注意力机制的字符序列识别网络进行矫正和识别。与其他经典的识别方法进行比较,本研究的方法可以生成金属凹凸字符局部纹理细节显著性增强的图像,并且字符识别准确率达到97.2%,在生产制造业中的金属表面凹凸字符识别难题上有较大的应用前景。
其他文献
我国是产茶大国,茶产业是我国特色优势产业。截止到十三五末,我国18个主要产茶省茶园面积达到4600多万亩,干茶产量达到280多万吨,产值为2400多亿元。在茶产业规模快速增长的同时,我国茶产业普遍面临一个采茶难的问题。传统的手工采茶,采摘的芽叶形状完整,鲜叶等级层次分明,但采摘效率低下,易受采摘劳动力短缺、天气恶劣、茶叶采摘周期等影响。改变传统的茶鲜叶采摘方式对茶产业转型升级是较为关键的一步,鲜叶
学位
利用溶胶-凝胶技术对纺织品进行功能性整理是目前纺织领域的一个热门课题。其中,溶胶-凝胶法对棉类织物的超疏水性处理是国内外研究的热点。近年来,二氧化硅(Si O2)在纺织材料中得到了广泛的应用,但是纳米Si O2与织物的粘附性很差,对其在纺织行业的实际应用产生了比较大的制约。故必须加强纳米Si O2与纤维之间的粘附力,在棉织物上构建微纳米粗糙结构,从而制备耐洗性能优异的超疏水性纺织品。论文的主要研究
学位
我国生活垃圾填埋存量超80亿吨,占用土地超10万公顷。众多建于20世纪90年代的卫生填埋场容量接近饱和,正面临对已填埋垃圾进行开挖以延长其使用年限或封场后对场地进行再利用的需求。简易堆场因缺乏完善的地下防渗和顶部覆盖系统,产生的渗滤液和填埋气容易造成地下水、土壤和大气污染,亟需进行治理并实现土地复用。利用好氧降解技术加速生活垃圾稳定化进程,是实现填埋场开挖增容、污染治理和土地复用的重要途径。目前,
学位
保暖性是决定消费者购买羽绒服、羽绒制品的关键因素之一。因此,进一步加深对羽绒保暖性的探究,对于满足消费者热舒适性需求和羽绒服保暖性设计十分必要。传统羽绒制品的保暖性测试方法包括客观实验法以及主观评价法,此类方法稳定性较差、成本较高,而计算机仿真模拟可以一定程度上弥补这一缺陷,因此通过建立数值模型对织物传热性能进行模拟已成为当下重要发展趋势。本课题从影响羽绒保暖性的三个因素——织物、填充密度和绗缝数
学位
对于交通事故的防治研究在全世界范围内都拥有重要的研究意义,而驾驶员的人因失误是导致交通事故的主要原因,这就要求研究者们应该致力于设计更加有效的驾驶预警系统来确保驾驶安全。视听双模态预警是一种通过视觉和听觉模态共同传递信息的新型驾驶预警系统,其相比于传统的视听触单模态预警,在提高预警信息识别率、平衡心理负荷以及提供冗余增益方面都有明显的优势。但是不良的视听双模态预警设计可能会掩盖该优势甚至损害驾驶安
学位
蝶阀作为一种用于实现调节流量、控制启闭的调控部件,对系统的安全稳定运行起着十分关键的作用,广泛应用于航空航天、能源、石化、生物医疗等诸多领域,保证了流体在管道内输送及内部循环的有效运行,是系统运行不可或缺的重要组成部分,而蝶阀内部空化问题是设计和使用蝶阀时需要考虑的重要影响因素。空化是蝶阀瞬态调节过程经常会出现的一种现象,该现象的存在会导致设备在运行使用过程中关键部件发生损伤,影响设备使用及系统运
学位
大环主体分子的高效构筑,历来是驱动超分子化学蓬勃发展的强劲引擎。构象固定的刚性多环主体分子为构筑高级复杂的机械互锁结构提供了重要平台。柱芳烃寡聚体是一类具有多个柱状空腔的主体分子,可以构筑多层次自组装结构。其中,以柱[5]芳烃二聚体最易制备。然而,目前为止,这类多环分子大都结构柔性多变,对于进一步制备机械互锁结构缺少预组织。本论文发展了一类刚性的构象固定的氧杂杯[4]芳烃桥连柱[5]芳烃二聚体,引
学位
近年来,二维拓扑材料因其优异的电子特性和理化性质受到研究者们的广泛关注。拓扑电子态和拓扑材料学已成为了凝聚态物理领域最热门的研究方向之一,具有极其重要的科学意义,为下一代自旋电子器件和低维磁存储介质提供了无限可能。其中,拓扑绝缘体是一种内部绝缘、表面导电的材料,其表面存在着一种受拓扑保护的特殊量子态。它不仅拓宽了研究者们对宏观量子物态的认识,同时在未来低功耗自旋电子器件、新型热电、磁电器件等领域的
学位
从环境中获取绿色能源来替代或部分替代化石燃料对于人类社会的可持续发展至关重要。多种可持续绿色能源(如太阳能、热能和机械能)已被用于驱动各种催化反应(如光催化、热释电催化、压电催化)。但是,当前光催化剂面临光生载流子复合率高和太阳能利用率不足等问题,导致光催化技术难以满足实际应用的要求。相比太阳光的不稳定性,环境机械能(如水力能、潮汐能)的输出更加稳定,因此机械能驱动的压电催化是光催化的有效补充技术
学位
三维形状一直是计算机视觉领域重要的研究对象。三维形状生成是从概率空间中采样生成真实且新颖的三维形状,它不需要大量标注信息,通过无监督的训练,实现从低维空间到高维空间的映射。这在游戏建模、虚拟现实、创意设计、智能加工制造业都有广泛的应用。近年来,很多研究者开始将深度神经网络与不同的三维表达方式结合来研究三维形状生成,如体素、点云、网格以及隐函数表达方式。体素数据具有良好的结构特性,便于特征学习和计算
学位