复杂背景字符识别前处理研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:begoodboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通用字符识别软件对航空公司飞机票图像的识别效果非常不理想,影响识别的主要原因是机票种类的多样性,打印的不规范,加上票面各种特征的噪声干扰。 上海航空公司机票数字影像管理系统是针对上海航空公司对机票字符识别的要求,开发的自动化数字影像系统。一期系统提交用户后,我们针对用户提出的新需求和反馈结合发现原有系统中一些问题,不断对系统进行调整,以期达更多的识别信息、到更快的速度、更高的识别率和更好的系统易用性。 前处理是字符识别研究一个非常活跃的领域,其特点是前处理方法的多样性和对各种不同情况的适应性。对于机票识别系统本身而言,由于需要处理票面噪声并对票面信息进行分类,以完成提取或去除,其本身对于本系统和整个课题也非常重要的一个研究分支。某种意义上,对待识别票样合理而高效的前处理算法和前处理流程,是整个数字影像管理系统的关键点和技术特色所在。 课题研究主要针对OCR部分的前处理模块,在原有系统对字符识别研究的基础上,根据用户新需求,提出了完善系统的方式,并结合实际系统,详细介绍在研究中已经验证的算法和解决此类问题的一般思路。 本文首先介绍了目前民航票据处理的现状和需求,简要描述原有一期系统的功能、用户对原有系统的反馈和新需求。接着按照前处理在灰度空间和色彩空间两个大方向分别介绍了灰度和色彩空间前处理的算法。灰度空间的研究工作主要包括:在原有Ostu和Niblack基础上对Bersen、Eikvil二值算法的实现和进一步研究,灰度形态学在定位线提取和去除和信息复原上的应用,字符串定位算法和单字符切分流程;色彩空间上的工作包括:色彩空间的基本知识介绍,色彩模型的选择,HSV颜色模型的介绍和特点,HSV颜色模型对字符信息提取,YCbCr颜色模型的简要介绍,YCbCr模型对图像增强及在此基础上实现底纹和文字分离的研究。 然后给出在灰度空间和色彩空间分别进行前处理后,字符切分正确率的比较。文章的结尾部分对所做工作进行总结,并给出了需要继续完善的方面和未来工作的方向。
其他文献
在因特网发展的初期,网络应用主要集中在电子邮件、文件传输等传统应用,它们对服务质量QoS(Quality of Service)不敏感。随着因特网中各种技术的迅猛发展,一些新型移动业务不
随着网络的发展,网络复杂性和异构性的特点日益突出,网络管理已成为网络系统运行好坏的关键,而网络的拓扑结构发现是网络管理的基础。传统的子网拓扑发现主要依赖于ICMP协议
本文以供应链管理软件的研究开发为背景,从中抽象出面向构件的软件开发的一般过程、原理和方法。首先介绍构件化软件开发的思想,阐述了基本概念以及建模机制;接着,阐述模型驱
全文检索式搜索引擎越来越成为用户使用互联网的重要工具,它的技术直接来源于信息检索领域,并根据互联网的特点进行了大规模的改变。然而由于互联网本身的涉及学科众多,用户
信息检索模型的研究和发展已经历经70余载,在过去相当一段时间里,信息检索还只限于专业人员使用,模型的实现原理也比较简单,人们获取信息的途径并不依赖于信息检索,因此用户对于信
Internet的飞速发展以及它开放式的特点使得网上的信息不断的膨胀,Web已成为人们不可缺少的信息源。Web中存在着大量的描述实体间相互关联的信息,与此同时实体之间的相互关系
本文针对灰色不确定性问题,对灰色系统与神经网络的特征进行深入的分析研究,从两种技术在信息的表现上存在的相似性入手,把两种技术有机融合。 本文研究并建立灰色神经网络模
随着计算机网络规模和应用领域的日益增大,网络已经成为人们日常工作和生活的重要组成部分。但是由于网络复杂性和异构性的不断增加,通过网络传播的病毒数量和各种人为破坏因
实现教育的个性化,说到底是一种对人的尊重。每个人都是不同的,忽略人的差别,漠视人的特殊性既不符合伦理道德的要求,也不符合教育的本质目的。基于现代科学技术的智能教学系统为
整个社会的安全问题关系到千家万户及各个单位,如何有效地安全防范和打击犯罪,使公安部门能迅速接警、迅速处理,是一个既复杂又重要的问题。建立一套完善的防盗防劫防火安全