工业货箱文本检测识别技术研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:chenfurongyalan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能和深度学习技术的发展,复杂场景下的文本检测识别技术逐渐成为计算机视觉的热门研究领域。在工业运输环境中,员工需要驾驶叉车运输货箱到达指定仓库,而由于人工原因经常会出现错看货箱编码、漏送货箱等情况,导致运输效率低下。因此本文从复杂场景下的文本检测识别技术入手,通过文本检测识别技术识别货箱上的编码,从而帮助员工更清晰、更直观地了解货箱编码。此外,在实际工厂环境下,存在光线昏暗、文本不规整、设备有限以及文本载体不一等因素,从而使得文本的检测识别成为了一项具有挑战性的任务。针对这些问题,本文对工厂环境下的文本检测与识别技术展开了研究,主要贡献如下:(1)针对工业货箱运输过程中货箱文本的检测问题,提出了基于双线性特征向量融合的移动端文本检测方法。该方法采用残差网络进行特征提取,并利用特征增强的Ghost模块替换基础残差块,在减少计算量的同时保证网络的学习能力。而后为了融合不同尺度的文本关键特征,采用特征金字塔增强模块提取图像高低级信息和双线性特征向量融合模块融合关键信息,抛弃非关键特征,从而提升不同尺度文本的特征表达能力。最终为了提高网络检测精确率,在特征融合模块将两者的输出进行拼接,并采用自适应阈值的可微分二值化后处理算法预测文本具体位置。(2)针对工业货箱运输过程中货箱文本的识别问题,提出了线性融合位置信息的货箱文本识别方法。该方法采用文本矫正模型矫正不规则文本,随后通过文本特征增强通道注意力模型增强含有语义信息的文本特征,抑制非关键特征。为增强特征序列的位置信息,利用线性编码的方式获得位置编码,并采用线性操作将其嵌入特征序列中。最后在特征融合解码器中与原特征序列进行拼接并通过基于注意力机制的解码器进行解码。针对货箱文本没有明确上下文关系的问题,设计字符级别监督模块,根据文本特征直接对文本进行分类,提高网络识别文本的准确率。通过在公开数据集上进行实验,证明了本文方法的实时性和有效性。并在真实运输场景数据集上与SOTA方法进行比较,实验结果表明,本文的方法性能最优。最终设计并实现货箱文本检测识别系统,同时将系统应用于真实运输场景。
其他文献
随着近些年来科技的进步,计算机、传感器等设备的可用性和可负担性变得更高,越来越多的工厂从“制造”走向“制造”,工业信息物理系统(CPS)在其中发挥着重要的作用。工业CPS可在生产制造过程中融合计算、通信与控制等多项技术手段,使多类生产制造设备协同工作,从而实现生产过程的智能化。大多数工作为了对CPS进行性能分析,牺牲了模型的部分描述能力,从而无法描述工业CPS中设备之间的交互行为。此外,将现存CP
学位
随着北斗系统的逐步应用,海上渔船定位数据越来越丰富,基于多源数据协同监控成为船舶监控系统(Vessel Monitoring System,VMS)的重要研究方向和发展趋势。针对传统VMS多源数据利用率低,不能有效协同多源信息精准监控渔船状态的问题,本文设计基于多源数据协同作用的渔船监控系统。该系统既可关联多源轨迹识别目标渔船也可基于轨迹识别渔船作业类型,进而实现海上渔船状态的精准监控。其主要内容
学位
随着人口老龄化加剧,老年抑郁(Geriatric depression,GD)正成为一个全球重大公共卫生问题。经颅磁刺激(Transcranial magnetic stimulation,TMS)是一种已被证实治疗成年人难治性抑郁症的有效干预手段,但TMS对GD疗效仍不清楚。这篇综述提供了TMS治疗GD一些新观点,探讨了TMS应用临床治疗GD的可行性。
期刊
随着深度学习技术在人工智能各个领域的快速发展,深度神经网络(Deep neural network,DNN)模型日益复杂,数据集规模不断增大。在单机单卡环境下的DNN模型训练速度已经无法满足日常的研发需求,因此研发人员开始将DNN模型训练过程逐渐转移到多机多卡环境下使用多个计算设备进行并行训练,从而加快DNN模型训练速度。分布式深度学习(Distributed deep learning,DDL)
学位
<正> 前言目前,酸度对雨水水质的影响已引起人们的关注。pH值则是衡量雨水水质及雨水酸度的主要指标。由于雨水的采集方法及分析平均值的计算方法各有不同,这佯,雨水的平均pH值也有所不同。至今日本还没有一个在同一标准下计算各地区雨水pH值的统一方法。在探讨雨水平均pH值计算方法的同时,此文将以计算结果为依据,推断一下日本各地区雨水的年平均pH值及其分布情况。
期刊
近年来,室内可见光定位系统发展迅速,其定位精度高,部署和维护成本低,有丰富的频谱资源并且可以工作在电磁敏感的场所,因此具有实现室内外定位服务一体化无缝切换的潜力。基于上述原因,室内可见光定位系统成为了室内定位问题的研究热门。本文研究了室内环境下基于光电二极管的可见光定位系统,利用偏振光实现了可移动物体的定位机制,丰富了可见光定位系统的定位技术手段,拓展了其应用场景。因定位精度高和功耗低的优点,基于
学位
随着人工智能的不断发展,文档图像的分析和识别技术被广泛应用于教育行业。目前,大多数文字识别技术能够较好地处理语文或英语等结构相对简单的文档。但是,对于数学类文档,由于其内部存在着复杂的数学表达式,其精准识别仍然是具有挑战性的难题。针对数学文档的自动分析与识别全流程,本文基于深度学习技术构建了一系列文档图像增强、分析和识别的算法。具体而言,本文的主要研究内容包括如下三个部分:(1)本文提出了一种基于
学位
学位
<正> 酸雨是当代世界上面临的主要环境问题,并已成为人们普遍关注的公害之一。近年来,我国各地区对大气污染和降水化学成分的分析表明,我国南方地区酸雨出现的频率大大高于北方地区。由于城市工业区排出的二氧化硫、氮氧化物等污染物,不只污染城市空气,而且可随着气流输送到很远的距离。加之污染物可以作为凝结核,在云滴、雨滴形成的时候,就可能具有酸的因素。云内的成雨过程,以
期刊
随着教育科研人数激增以及学术活动的多样化发展,网络中文献的数量庞大且增长迅速,因此各种在线学术平台相继构建。发表、检索和阅读学术文献是学校科研、教学、管理和交流工作的重要组成部分,学术平台也逐渐成为智慧校园建设的重要基础平台。在高校中,重名人员日益增多,这些大量重复的姓名会极大降低学术平台中文献检索的效率,并且可能检索出错误的数据,给高校知识图谱的构建带来极大不便。姓名消歧系统凭借维护成本低、检索
学位