融合先验知识的场景文本识别应用研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:xiongxiaoxue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着科学技术的快速发展,具有拍照功能的智能手机等多媒体终端产品也得到广泛普及,这使得人们获得日常生活中的自然场景图像更加容易,同时自然场景图像的文本提取和识别有着广泛的应用前景。本文将以拍照获得的医学化验单为例,融合化验单的先验知识,针对自然场景图像的模板匹配、文本定位以及识别技术进行研究,并搭建一套完整的文字识别系统。本文具体工作内容如下:(1)提出基于特征的模板匹配算法并实现,以确定待测样本对应的模板。该算法通过对化验单的样本和模板进行版面分析,得到样本和模板的版面特征。在进行模板匹配时,通过计算样本与各个标准模板之间的集合相似度,相似度最大的类别则作为样本所归属的类别。本文提出的模板匹配算法,能够在镜头畸变因素的干扰下改善模板识别的准确率。(2)改进文本定位算法并实现,对样本中待识别的文字区域进行文本定位及识别。改进的算法能够自适应搜索待识别区域,获得化验单各个具体项目的最佳定位坐标,进而对已定位的文本进行识别。本文提出的改进的文本定位算法,能够更加精准地获得待识别文字的坐标位置。(3)在新的模板识别算法和改进的文本定位算法的基础上,本文采用分布式架构方案,设计实现了一套完整的文字识别系统。系统包括图像录入、图像存储、图像处理、识别结果显示等模块。本文所采用的分布式方案能够提供并行工作和负载均衡处理的能力。测试结果表明,本文设计的模板匹配算法和改进的文本定位方法具有95%以上的字符识别准确率,达到了预期要求,本系统能够成功应用于工程实践。实验结果表明本文的算法是有效的,并且具有一定的实用价值,可以(但不局限于)应用于医学化验单识别系统的字符识别模块,对于具有固定格式的表格或票据的识别同样有效。
其他文献
创新就是对原有传统观念的怀疑,是对历来陈旧意识的革命.纵观几千年来国内外科学发展.可以说没有创新就没有社会的进步,没有创新就没有人类发展.江泽民总书记对此做了精辟的总结:“
在中国金融工会召开的金融职工先进经验交流会上,组织了北京、上海、广州、张家口、瀋阳、哈尔滨等六个地区人民银行的出纳先进工作者举行了报告会及实际表演,並通过各小组讨
为准确描述我国公民水素养水平,有针对性地加强水资源宣传教育,提高公民水素养,在科学素养、环境素养的研究基础上,设计包含有水知识、水态度、水行为3个一级指标、10个二级
本刊讯 四川移动省公司直属机关团委近日组织开展“我为汶川植棵树”活动,30余位志愿者赶赴“5·12”地震灾区汶川县凤坪坝,在荒山上种下50余颗爱心树苗,表达了移动人关爱地
包装用色问题,虽然在日常生活中是司空见惯的,但事实上,世界各国由于民族、宗教以及“色彩使用习惯”是千差万别的,不了解这方面情况就会出纰漏。例如,我国某家纺织厂接受加
【正】 王行長拿着中心支行刚發來的一份通報,反覆的看了又看。心想,怎麼搞的,又給中心支行批評了一下子。於是,他找來農金股股長和整理材料的幹部,用訓斥的口氣說:‘我們做
人体衰老常伴随皮肤质地改变、脂肪萎缩、面部软组织体积及弹性的改变等,因而导致面部皮肤松垂及皱纹形成等外部特征即为面部老化。传统的面部年轻化方法包括各种手术及非手
<正> U型管引流术是用于胆道结石、肿瘤、外伤、炎症所造成的肝内胆管狭窄及高位胆管狭窄的一种手术方式。对多次手术,或无法手术仅为胆道狭窄的病人能解决胆汁引流;对胆道肿
<正> 重症肌无力症,最严重的并发症是呼吸麻痹。重症肌无力症本身在目前情况下治疗上困难还很多,有时呼吸麻痹不能在短时期内得到改善,因此病人用人工呼吸机的时间极长,这就