基于深度学习的金属板带产品标签文字检测与识别方法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:qhjxiaofeitian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
金属板带产品标签文字信息的检测与识别应金属制造工业运输作业的需求产生,用智能化方法代替人工方式不仅能够提高标签中信息记录的准确性,而且能够助力智慧物流的构建,具有重要的研究意义。本文就金属板带产品标签文字信息的检测与识别任务,深入研究了经典的直线检测、透视矫正、基于深度学习的语义分割、文本检测与识别等技术,提出了集矫正处理、文本检测、识别和纠错于一体的端到端金属板带产品标签文字识别解决方案,同时进行了核心算法的集成和演示系统的开发。针对部分算法的缺陷进行了改进,利用现有开源数据集以及金属板带产品标签数据集进行实验分析,论证了算法的可行性与有效性。本文研究的核心内容概括如下:(1)针对工业现场拍摄的金属板带产品标签图像中标签区域存在的透视、仿射变换以及扭曲等问题,实现了基于直线检测定位矫正的方法,同时利用线性判别分析灰度化方法为直线检测提供支撑,提升了直线检测的效果。在传统图像处理方法无法取得较好泛化性的情况下,开创性地提出了基于深度学习语义分割定位矫正的方法,为实现精确的文本检测和识别奠定了坚实的基础。(2)深入研究了基于深度学习的文本检测方法,通过对EAST和Pixel Link检测算法的理论研究和实验分析,详细探讨了基于回归思想和分割思想在场景文本检测中的优劣性。根据工业现场图像的特点,实现了基于Pixel Link的改进方法,同时实验论证了改进后算法的高效性和精准性。(3)对联接式时间分类方法CRNN进行了深入的理论研究,针对工业场景所得文本图像具有的模糊、遮挡、光照以及扭曲等特点,利用注意力机制的方法对原始CRNN网络进行加深和加宽,实现了 CRNN算法的改进,拓展了特征提取的能力,提高了算法对于干扰信息的辨识能力,所得模型取得了良好的识别效果。(4)针对本识别场景的特殊性,提出了正则拆分匹配、相似度字典匹配以及混合匹配的方法,实现了关键字段的检索与纠错,最后基于QT框架对本文所提出的解决方案进行系统开发,实现了端到端金属板带产品标签文字的检测与识别。
其他文献
交通客流逐年增加,使得交通拥堵问题日益严重,因此需要对交通网络进行控制。经典控制理论不能反映出系统的内部结构与联系,且对于大规模,结构复杂的网络难以控制,而交通网络作为典型的复杂网络,更适合用复杂网络能控性的方法来研究。本文结合网络科学的相关理论,针对交通网络的能控性问题,研究了交通网络模型的建立,交通网络中基于负载系数的控制站点辨识方法,以及双层交通网络的静态特性,主要内容包括以下两个方面:首先
学位
受人类创造性解决问题过程——头脑风暴会议的启发,史玉回教授于2011年第二次群体智能国际会议提出了头脑风暴算法,算法通过聚类、替换和创新机制来尽可能地产生新的想法,从而逐代地对优化问题进行求解。随着时间的发展,对头脑风暴算法的研究也从单目标优化问题转向了多模态问题、多目标优化问题等,在很多领域所展现出来的优化性能都不亚于其他群体智能优化算法。但是,头脑风暴算法在超多目标优化问题上的相关研究并不多,
学位
钢铁产品生产流程长、工艺复杂。其中,炼钢-连铸流程是钢铁生产全流程的关键环节,对钢铁产品的生产效率和质量起着决定性的作用。炼钢-连铸流程涉及众多工艺参数,包括在作业现场检测的工艺参数和生产过程控制参数。其中,生产过程控制参数是指导与控制炼钢-连铸流程的关键工艺参数。因为人工设定指导生产的关键工艺参数有效率低、易出错、参数质量因人而异等弊端。因此,本文基于工艺参数设定值的历史数据,基于机器学习的方法
学位
会馆建筑是大运河苏州段沿岸独特的遗产类型。然而在苏州城市更新的过程中,大量会馆建筑遭到破坏,其生存状况十分严峻。本研究基于设计学的视角,主要运用文献研究、实地调研、归纳分析和案例分析法对大运河苏州段的会馆建筑进行研究。通过对会馆建筑的价值和保护利用现状进行深入挖掘和系统分析,归纳其保护利用工作中的现存问题。进而提出建筑与环境和价值共生、完善相关法律法规、增加会馆公共属性、引导公众参与保护、活化记忆
学位
作为国民经济的支柱产业,钢铁企业的节能减排问题一直受到高度重视。而氧气系统作为钢铁企业能源系统中重要的一部分,其平衡调度问题一直是钢铁企业节能减排管理中的关键问题。本文对钢铁企业氧气的最大用户-转炉炼钢过程的氧气需求量预测问题以及氧气系统优化调度问题进行研究。主要工作是结合转炉炼钢吹炼计划和氧气需求量历史数据预测未来计划期内的氧气需求量,对制氧机组进行调度,达到氧气系统的供需平衡,减少氧气放散率,
学位
钢铁表面缺陷是决定钢铁产品质量的重要因素,在钢铁生产过程中,产品质量检测是必不可少的阶段。钢铁表面缺陷的自动分类是钢铁产品质量智能分析系统中的关键环节,对钢铁企业的高质量发展至关重要。本文以某大型钢铁企业的钢铁产品表面缺陷图像为对象,结合机器学习和深度学习先进理论,对基于自步学习的钢铁表面缺陷图像分类方法进行了深入研究,实现了钢铁表面缺陷图像的自动分类,主要研究工作如下:(1)针对钢铁表面缺陷图像
学位
目的 探讨全瘤及瘤周感兴趣体积(VOI)双区域T1 mapping定量参数结合钆塞酸二钠增强MRI对肝细胞癌微血管侵犯(MVI)的评估价值。方法对我院2019年1月~2022年9月术后病理诊断为单发性肝细胞癌的72例患者进行回顾性分析,并根据MVI表达状态分为MVI阳性组(n=23)、MVI阴性组(n=49)。术前行钆塞酸二钠增强MRI T1 mapping扫描,得到平扫(Pre)、肝胆期(HBP
期刊
脑瘤,即颅内肿瘤,是神经系统中常见的疾病之一。脑肿瘤分割技术在脑肿瘤的诊断和治疗的起着关键作用。目前,脑肿瘤分割以具有高组织分辨率的核共振成像(MRI)为研究对象,MRI脑肿瘤图像的空间分辨率差、对比度低和边界不清等复杂问题难以解决,从而降低脑肿瘤分割的准确率。同时,全卷积神经网络在医学图像语义分割展现出优异的性能,为脑肿瘤分割奠定基础。针对特征提取方式影响分割准确率的问题,引入了多尺度特征融合,
学位
电动汽车作为物流领域应用越来越广泛的一种配送工具,具有节能环保、噪声小、使用方便、能源利用率高等优点。由于电动汽车续航里程有限,电量的补充时机和换电站的选择是规划配送路径时需要重点考虑的问题。需求可拆分思想作为传统车辆路径问题的一个重要分支,可以有效减少配送过程中使用的车辆数并降低行驶总路程,还能解决客户点货物需求量大于车辆最大容量的问题。因此本文研究了需求可拆分的电动汽车路径问题(electri
学位
经济的快速发展和人们对物流需求的不断增长,使得人们与物流之间的关系变得越来越密切,也为物流行业带来机会的同时也带来了许多挑战。第四方物流作为物流运作的重要模式之一,其中的物流方与客户之间的匹配是一个重要的决策问题,对于提高配送质量和客户满意度有很大作用。本文在第四方物流背景下在现存的一对多稳定匹配方法基础上进行研究,从多个角度探讨了供需双方有限理性的稳定匹配,进行了以下三方面工作。(1)本文提出了
学位