基于语义分割的文本检测模型在票据识别中的应用

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:honest1988li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字,作为一种传播信息的载体,其往往包含了丰富的同时也是人们需要的重要信息。自然场景文本识别就是检测识别自然场景中的文本实例,包括车牌、路牌和广告牌等,所以自然场景文本识别在日常生活中有着广泛的应用前景。本文的研究内容就是如何准确提取医疗票据图像中文本信息,从而保证后续文本识别的准确性。因为人工录入效率低、成本高,并且录入人员会因疲劳而导致出错,而如果能够使用场景文本检测算法通过机器完成录入票据信息的任务,就可以减轻人力负担且提升工作效率。为了解决医疗票据图像中文本检测的难点,本文在目前文本检测领域中最前沿的神经网络模型—渐进式尺度扩展网络(PSENet)的基础上,提出了一类新的解决方案—多类别渐进式尺度扩展网络(MPSENet)。MPSENet与PSENet的最大的区别在于,MPSENet将PSENet的输出由单类别输出改为多类别输出,这表明MPSENet不仅能够检测文本区域,还能根据文字的颜色字体特征将文本分类检测。本文之所以这样设计模型,是因为医疗票据中的文本可以划分为多种类别(包括印刷文字、印章文字等),而且不同类别的文字会相互重叠覆盖,因此将这些文字分类检测就能很好的解决上述问题,而且后续处理中也可以将文本实例分类处理,能够降低后续处理的工作量和难度并且提升识别准确率。实验阶段,本文准备了两个中文文本检测数据集用于验证本文提出的方案的可行性,这两个数据集分别是人工合成的自然场景文本检测数据集和我们自己收集标注的医疗票据数据集。最后实验结果表明,MPSENet模型在本文的医疗票据数据集上实现了F-measure为76.00%的检测效果,同时还对比了MPSENet与百度云、旷视科技的商用方案的检测结果,证明了MPSENet的检测效果一定程度上优于这些商用方案的检测效果。
其他文献
机器人技术进入医疗领域,改变了传统的手术方式,进一步推动了机器人技术理论的发展。针对脊柱微创手术特点以及传统脊柱微创手术中存在的问题,课题组设计了一套框架式微创手术机器人系统,用以辅助医生进行脊柱微创手术操作。本系统包括虚拟手术系统、遥操作系统和机器人控制系统。本文在框架式微创手术机器人平台搭建完成的基础上,提出一套适用于临床手术的高精度控制方法,具体内容划分如下:1)分析脊柱微创手术所需的手术空
近些年来,随着生活质量的提高,人们对于自身健康越来越重视。睡眠状况作为人体健康重要组成部分,也得到了更多人的重视。目前市面上也出现了很多对人体睡眠的感知设备,例如智能手环可以随身检测睡眠质量。但是这些检测都是接触式的,对于日常生活会带来不便,无法长期监测。故需要一些非接触式的感知手段对人体进行监测。目前利用从商品Wi Fi设备中检索到的信道状态信息(CSI)进行呼吸检测的潜力巨大。然而,现有的方法
纤维增强复合材料比强度高、比模量高、热稳定性好,同时具备一定的阻尼减振能力,因此被广泛应用于航空航天、汽车工业、体育器械与兵器工业等重要领域。工程实际中存在大量利用该类型材料制成的典型复合薄板结构件,如太阳能帆板、航空发动机风扇叶片以及大型风力机叶片等,随着它们的结构越来越复杂、工作环境越来越苛刻,由此引发的振动超标、磨损、疲劳失效等故障问题也越来越突出。因此,研究纤维增强复合薄板振动特性的先进测
材料隐身是在外形隐身的基础上进一步降低目标雷达散射截面(Radar Cross Section,RCS)的重要途径。频率选择表面(Frequency Selective Surface,FSS)作为一种新型隐身材料较传统材料在功能实现方式上更加多样化,在设计上具有更高的灵活性。目前关于频率选择表面的研究大多是平板反射率性能以及小角度30°范围内的单站RCS缩减。本文将结合频率选择表面阻抗层和金属反
在大数据时代,如何有效地对大数据处理的结果进行展示具有重要意义。目前针对大规模图数据处理的Web可视化系统需要消耗大量CPU资源完成计算和渲染,在展示大量图数据时受到浏览器性能的限制,导致效率较低。许多工具库通过不断优化算法,在布局性能上有了很大提升,然而渲染方面仍然效率不足。相比于CPU,图形处理器(Graphics Processing Unit,GPU)更适合处理大规模运算,但是在GPU上的
光纤陀螺仪是基于Sagnac效应的高精度角速度传感器,具有体积小、成本低、寿命长、功耗低、动态范围大等一系列优点,在航空、航天、陆地、航海等军用、民用领域都具有广泛的应用。然而,光纤陀螺关键元器件几乎都是从美国进口,国产率远远达不到95%的要求,设计具有自主知识产权的光纤陀螺专用芯片具有重要的意义。本文针对干涉式闭环光纤陀螺数字控制电路进行优化集成,设计光纤陀螺数字控制专用芯片,以满足光纤陀螺电路
受在线评论的评论质量参差不齐以及评论数量爆炸式增长的影响,消费者已经开始逐渐转变评论阅读的方式,从大范围阅读评论转变为只阅读顶端少数几条或十几条评论。在目前实际的评论领域中,对评论进行简单的分类排序,其粗略的排序结果已经不符合当今需求,而对评论进行简单的回归排序,其全局的排序结果又不够精确,也不满足目前消费者阅读评论的需求。针对现有评论排序研究在目前实际需求中存在的不足,通过将分类排序和回归排序进
相对于线极化天线,圆极化天线因其自身特点在遥控、遥测、雷达和卫星通信等领域得到了广泛的应用,特别是在Ku波段卫星通信中的应用。随着现代通信技术的飞速发展,对圆极化天线的带宽、增益等性能指标提出了更高的要求,基片集成腔(Substrate Integrated Cavity,SIC)天线具有尺寸小,高增益以及能有效抑制表面波等优点,已成为天线设计领域研究的热点之一。基于SIC结构,开展Ku波段宽带、
为了更好存储多元化的数据,存储系统中引入了局部修复码技术。局部修复码能够在保证可靠存储的同时,显著降低数据重构开销,因此适合应用于冷数据的存储。但是随着存储系统的不断发展,局部修复码的编码性能逐渐成为了限制存储系统发展的重要瓶颈。因此,充分利用存储节点所使用的廉价图形处理器(GPU)并设计实现一个能显著提高编码性能的局部修复码优化方案是当务之急。为了更好利用局部修复码提高存储系统性能,提出了一种基
工控系统涉及众多关键基础设施,一旦受到攻击将造成惨重的经济损失,然而工控网络相对比较封闭,内部没有足够的数据支撑,缺乏对于外部威胁的应对能力,并且传统的网络安全分析方法具有一定限制,只能预测已知攻击,无法预测未知攻击。为了提高工控网络安全分析能力,本文提出了一种数据驱动的工控网络安全分析框架,并围绕工控网络安全知识图谱的构建和应用开展研究。针对工控网络安全分析缺乏数据支撑的问题,本文将互联网中海量