印刷包装的文本检测与识别算法研究及其应用

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:yatou5004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在食品、药品等领域,产品外包装上必须附带如生产日期、有效期限、生产批次等印刷文本,其重要意义是明确保质期、保留可追溯途径。存在错印、漏印等质量问题的印刷文本会给企业带来法律风险。传统人工抽检方式存在开销大、漏检率高的弊端,而使用机器视觉技术能够实现更智能、更高效的解决方案。本文研究端到端的文本检测识别算法,并研发了一个印刷文本视觉检测识别软件系统。主要工作如下:(1)针对激光打印文本存在对比度低的问题,提出了一种边缘增强网络,能抑制背景并增强文本特征;针对特征图融合时存在的权重不合理问题,提出了一种权重自调节网络,能根据当前特征图调整融合权重;针对标准非极大值抑制算法耗时长、处理倾斜文本框效果不佳的问题,提出了一种改进非极大值抑制算法,基于文本分布特性水平合并候选框,然后使用网络回归的角度,能实现倾斜框非极大值抑制。(2)为了解决密集连接引入的特征冗余问题,提出了一种随机丢弃网络,通过丢弃某些通道数据的方式降低网络的特征冗余。喷墨打印文本的字符间距存在波动,这会让字符分割变得困难,为了解决该问题,提出了一种文本识别网络,通过全卷积网络提取序列特征、连接时态分类算法解码特征,从而实现文本序列识别。(3)基于提出的文本检测和文本识别算法,本文研发了一个印刷文本视觉检测识别软件系统。基于分层和分模块的设计理念,软件系统分为用户交互层、应用层和功能模块层。软件系统实现了网络通信、一键检测识别、延时剔除等功能。在印刷文本数据集上测试本文提出的文本检测算法、文本识别算法以及端到端的文本检测识别方式的效果。本文提出的文本检测算法在F1分数上达到了0.92,相较于YOLOv3提升了0.038;文本识别算法的准确率达到了95%,相较于CRNN提升了2%;端到端的文本检测识别方式准确率达到了93%。本文所研发的印刷文本视觉检测识别软件系统准确率达到工厂要求,整体误检测率在0.4~0.6%范围内波动。
其他文献
随着互联网技术的快速发展与全面普及,网络中的信息以惊人的速度产生和传递,“信息爆炸”的时代已经来临。推荐系统作为信息过滤的重要手段能够有效地缓解信息过载带来的消极影响,推荐系统在不断提高用户体验的同时带来了丰厚的经济效益,其重要性也日益凸显,越来越多的研究工作专注于推荐系统中的安全性问题。推荐系统中的投毒攻击可以通过虚假欺骗数据的注入来实现操纵推荐系统的目的,这种投毒攻击严重危害了推荐系统的正常运
学位
近年来,多媒体业务的蓬勃发展带来了网络中视频流量的井喷式增长,互联网用户开始追求更高质量的视频传输业务。随着小型卫星通信组网技术与发射技术日趋成熟,可全球覆盖的低轨道宽带卫星通信网络(低轨道卫星网络),为视频组播带来了新的发展契机。通过在低轨道卫星网络中部署软件定义网络(Software Defined Network,SDN)框架,可以克服地面网络分布式管理瓶颈,实现更高效的软件定义组播(Sof
学位
为保障工业系统的可靠性,尽可能避免因设备运行异常导致的危害,如何高效地检测出设备异常运行状态是一个急迫的问题。大多数异常的发生是一个渐变的过程,因此本文通过检测传感器采集的时间序列片段样本用于判别设备是否处于异常运行状态。基于传统信号处理的检测算法需要针对具体设备做特征工程,不利于应用到不同类型的设备,存在泛化性差的问题。而深度迁移学习能够自动地从不同类型设备数据中提取有用特征,无需依赖过多标注数
学位
随着近年来基于位置的服务(Location-based Services,LBS)的发展,人们对位置隐私保护问题的关注度越来越高。位置和轨迹数据通常会包含用户个人的敏感信息,直接发布会对用户隐私造成威胁。差分隐私(Differential Privacy,DP)作为一种具备坚实数学基础的隐私保护方法,在位置和轨迹数据发布中得到了广泛的应用。然而,现有的位置差分隐私发布机制,大多数只考虑静态场景的位
学位
如今视频传输已占据因特网中绝大多数的带宽,传统的视频组播方式会产生大量的带宽浪费。而新兴的大规模多层低地球轨道(Low Earth Orbit,LEO)卫星网络可以通过星间链路进行带宽优化的视频组播,显著减少流量浪费。目前对于卫星网络组播路由的研究集中在IP组播,但其路由性能和可拓展性有限,并不适用于大规模卫星网络。新兴的软件定义组播(Software Defined Multicast,SDM)
学位
证照作为公民的身份凭证,在金融、交通和医疗等领域都应用广泛。由于人工查验效率低下,难以适应日益加快的国际化进程,因此亟需实现证照的自动化查验。然而,证照种类繁多,版面结构复杂多样,证照表面印有复杂的背景图案和防伪特征并且常常出现字符污渍和缺损等情况,给现有算法带来了巨大的挑战。针对以上问题,本文提出了一套适用于证照的结构化识别算法。针对证照中细长文本检测困难问题,本文提出了一种分组多路可选择卷积,
学位
随着基于位置的社交网络平台的发展,产生的大量含有时空信息的签到数据给用户行为特征研究带来了新机遇。作为最具代表性的研究之一,跨社交平台用户身份匹配推动了用户跨域信息融合,促进了更优质的商业服务和个性化推荐质量,因此引起了广泛的研究关注。然而,在处理时空签到数据时,现有工作大都使用离散化方法,忽略了时空本身的连续性,导致严重的边界效应,影响算法性能。为了解决该问题,本文提出了基于关联位置连续签到模式
学位
慢性阻塞性肺疾病,简称慢阻肺疾病,是一种常见的慢性呼吸系统疾病。该疾病会让患者严重丧失劳动能力,这给患者的家庭以及社会带来沉重的经济负担。中医治疗慢阻肺疾病具有毒副作用小且标本兼治的优点,能够极大缓解慢阻肺患者的症状。目前我国的慢阻肺疾病患者基数大,有经验的中医数量不足,导致中医慢阻肺医疗资源面临着巨大的压力,因此研究慢阻肺中医智能诊疗尤为迫切。针对慢阻肺中医智能诊疗中的证型和症状多样化,且证型相
学位
零样本图像分类旨在解决缺失训练样本的未见类图像的分类问题。虽然近年来以监督学习范式在大规模数据集上训练的深度神经网络在图像分类等计算机视觉任务上取得了显著的性能提升,但是这些分类模型局限于训练集中出现过的已见类,无法对缺失训练样本的未见类进行有效地识别。然而,实际应用场景中不可避免地存在因为标注成本过高、样本稀缺、类别随时间变化导致的未见类图像样本的出现。为了解决此类问题,零样本图像分类方法期望借
学位
自互联网诞生以来,研究如何在海量的图像数据中检索出用户所需要图像的图像检索一直是计算机科学的一个基本问题。随着智能触屏设备的普及,草图逐渐成为一种重要的媒体模态,并使得草图检索成为一个热点研究问题。已有的草图检索只能检索在训练集中出现过的类别的草图。然而作为一个实际应用问题,在实际使用时很难保证训练集能够覆盖到所有的待检索类别。零样本草图检索任务,则要求计算机能够对训练集中未出现类别的草图实现草图
学位