自然场景下化验单文字检测识别研究

来源 :北京信息科技大学 | 被引量 : 1次 | 上传用户:xingzhe009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人工智能的发展为智慧医疗提供了强大的技术支持,以计算机视觉为基础的化验单智能解读能够使患者及时的了解自身病情,可以有效的提高就医效率,减缓就医压力。化验单智能解读首要工作是将化验单图像数据转化为结构化的文本数据。因此,自然场景下化验单文字检测识别任务尤为重要。针对当前存在的自然场景下化验单文字检测识别方法效果欠佳,无法达到实用标准等问题,本文融合了传统图像处理方法和深度学习方法对自然场景下化验单文字检测识别进行研究。具体从以下几个方面展开研究:1)提出了一种自然场景下的化验单文字检测方法(BHS-CTPN),可以有效解决当前化验单文字检测方法效果无法达到实用标准以及敏感信息区域无法有效过滤的问题。首先引入BRISK、Hough、Sauvola等一系列预处理方法进行化验单矫正、敏感信息区域去除和图像增强,其次在特征提取时卷积核的设定、anchor设定等方面改进CTPN网络模型,最后优化文本框合并策略。BHS-CTPN方法与CTPN模型相比,准确率、召回率、F1值分别提升了8%、10%、9%,与目前化验单文字检测领域效果最好的华为API接口相比,准确率、召回率、F1值分别提升了6%、3%、5%。大量实验结果表明,BHS-CTPN方法能够有效准确的检测到自然场景下化验单中文本位置,为后期文字识别奠定了坚实的基础。2)提出了一种改进CRNN网络模型的自然场景下化验单文字识别方法,可以有效解决文本框尺寸不一、文字模糊、形近字识别易错等问题。首先在特征提取时加深网络层数,其次根据数据分布设定文本框尺寸,最后对卷积核进行拆分,优化网络模型。改进的CRNN方法与CRNN模型相比,准确率、召回率、F1值分别提升了7%、5%、6%,与目前化验单文字识别领域效果最好的华为API接口相比,准确率、召回率、F1值分别提升了3%、2%、3%。大量实验结果表明,改进的CRNN方法能够精确的识别文本框序列,为后期化验单解读奠定了坚实的基础。3)提出了一种融合语言模型的自然场景下的化验单文字识别后处理矫正方法,可以有效解决自然场景下化验单文字识别在形近字识别方面容易出现混淆的问题。本文首先引入统计语言模型,对识别区域矩阵进行条件概率统计,预测最佳符合医学词库的识别结果,然后根据检查项对应关系进行前后矫正,最后基于融合的编辑距离和最长公共子序列方法进行识别结果矫正。引入后处理矫正方法后,准确率、召回率、F1值分别提升了2%、3%、2%。实验表明,融合语言模型的自然场景下的化验单文字识别后处理矫正方法能够进一步提高文本框的识别精度。综上所述,本文提出的三个方法,可以有效解决自然场景下化验单文字检测识别问题。为化验单智能解读做出巨大贡献,推动智慧医疗的发展。
其他文献
随着经济的快速发展,生态农业成为农业发展新型模式,并带动了生态农业旅游的发展。当今社会,人们的生活条件不断提高,消费观念也在不断改变,人们开始追求个性化的旅游。新颖
随着5G的逐步应用与发展,移动用户和移动设备数量的急剧增加,能耗问题将一直存在并且形势日益严峻。绿色通信受到越来越多的关注,能量效率(EE)指标因此成为衡量通信系统越来越
随着科学技术的发展以及社会发展的需求,主从遥操作机器人技术成为机器人研究领域的重点和热点,并广泛应用于排雷、原子能、深海、医疗和太空等领域。本文在国内外主从遥操作
目的:探究母亲孕前体重指数(BMI)对IVF/ICSI单胎子代认知和代谢的影响。方法:本研究以1904例3-6岁的IVF/ICSI单胎子代为研究对象,采用中国儿童的性别/年龄别的体重指数z评分对儿童生长发育进行评价。采用中文版韦氏儿童智力量表(C-WISC)对儿童的言语智力智商(VIQ)、操作智力智商(PIQ)和全量表智力智商(FIQ)进行评价。采用线性回归模型和logistic回归模型控制混杂因
当前计算机发展由于冯诺依曼架构限制和摩尔定律逐渐失效,已经接近瓶颈。而另一方面,在大数据时代亟需研发新一代的计算架构与硬件,这种新型计算机能够依托有限的带宽与存储容量,智能、实时并高效的处理数据量极为庞大的视频数据流,实现如目标运动模式识别等智能计算需求。计算存储一体化的神经网络和神经形态硬件为这提供了一条全新的道路。我们研究的脉冲神经网络是基于类脑研究的具有很高生物似真性的网络,采取了不同于当前
《政府工作报告》承担着对外宣传中国政策的作用,其英文翻译质量的好坏直接影响着我国的对外形象,具有十分重要的作用。《政府工作作报告》中有大量中国特色词,加大了翻译难
随着经济的不断发展,软件行业之间的竞争愈演愈烈,软件公司需要研发新的软件来满足人类工作生活上日益增长的需求,设置合理的软件项目调度方案显得极为重要。面对规模越来越
学位
网络欺凌(cyberbullying)已经在世界范围内成为了一个普遍性的社会议题,并对青少年的身心健康造成一系列负面影响。一般紧张理论认为生活中的紧张压力事件会使人产生焦虑、抑郁等负面情绪,个人为疏解情绪压力可能做出一些越轨行为。我国应试教育背景下,学习压力成为青少年生活的主要压力来源,网络空间给青少年提供了满足情绪表达的机会和场域,可以弥补他们因学习压力带来的挫败感和焦虑情绪,青少年阶段的特点又使他们很容易受到诱使而做出网络欺凌行为。因此,本研究以一般紧张理论为理论视角
自20世纪90年代首次提出单一纳米孔作为一种潜在的快速和低成本的DNA测序工具以来(PNAS,1996,93,13770),关于生物纳米孔、合成纳米孔和纳米沟道等纳流体器件的研究已经得到广泛的报道。纳流体器件由于其纳米尺度涉及多种物理机制耦合,比如流体动力学方程、沟道壁面电荷引起的静电学方程、以及描述离子运动的离子输运方程。多物理场耦合使得纳流体器件的物理特性分析十分复杂,目前缺乏清晰明确、一致认