特定领域OCR系统的精度与速度问题研究

来源 :北京邮电大学 | 被引量 : 7次 | 上传用户：flw00

【摘要】

：

经过五十多年的艰苦努力，人们在文字识别领域取得了众多成果，逐渐成熟的文字识别技术使得满足金融、邮电通信、新闻出版、办公自动化等领域对实用化OCR技术的迫切需求成为可能

【作者】

：

陈光

【出处】

：

北京邮电大学

【发表日期】

：

2007年01期

【关键词】

：

模式识别文字识别训练样本生成加权动态网格特征提取渐进的马氏距离

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

经过五十多年的艰苦努力，人们在文字识别领域取得了众多成果，逐渐成熟的文字识别技术使得满足金融、邮电通信、新闻出版、办公自动化等领域对实用化OCR技术的迫切需求成为可能。虽然最近几年才开始尝试把OCR技术应用到金融票据和信息检索领域，但是由于强烈的市场需求的推动，这些研究方向已经逐渐成为文字识别领域的两大应用热点，大大推动了OCR理论和技术的进一步发展。在金融领域，OCR主要用于对金融票据上的信息进行识别，进而完成自动化的结算、后督等功能；在信息检索领域，主要利用OCR将纸质媒介上的信息转换为可供计算机处理的格式，使用户能够方便的检索和访问，同时提供进一步信息挖掘的基础。目前，各国的研究机构和公司都加紧研究面向实用的OCR技术，各方面对此都非常重视，北京邮电大学模式识别实验室(PRIS实验室)的金融票据OCR技术研究不仅与许多企业和银行部门展开了合作，也受到了国家863项目的支持。在这种背景下，本文的研究目的就是参考国内外最新研究进展，在PRIS实验室的技术积累基础之上，在“金融票据OCR系统中的成套关键技术”的国家863项目的支持下，对金融票据OCR系统中的关键技术进行研究和改进，并结合最新的信息检索领域的应用，提出相应的解决思路。本文进行的主要工作如下：1．对于汉字识别这样一个统计模式识别的问题来说，训练样本的数量和质量对于系统的识别性能是非常关键的。当训练样本的数量和质量不能满足需要时，我们无法正确估计样本的统计分布，无法得到最优的识别率。本文提出一种新的基于余弦整形变换的手写汉字训练样本生成方法，可有效提高现有手写汉字识别系统的识别性能。通过对原始训练样本进行基于余弦整形变换的样本生成和样本筛选，一定程度上缓解了某些条件下训练样本不足的问题，增强了识别器的扩展能力和鲁棒性。2．手写体汉字变形问题是手写体汉字识别中的关键问题，归一化处理是直接从汉字点阵图像上矫正手写变形、减小属于同一类别的不同模式之间差异的主要途径。但是，在对图像进行规整的过程中，也引进了可能会影响识别精度的锯齿等不利因素。为了更有效的提取手写汉字的特征，提高识别精度，本文提出了一种利用非线性归一化过程产生的坐标变换信息来提取手写汉字有效特征的方法。该方法通过非线性归一化获得各有效像素点在原汉字图像及规整后汉字图像中的坐标变换关系，在原图像上抽取各点特征，在归一化图像上进行网格的均匀划分和特征统计并形成用于分类的特征向量。该方法有效克服了以往先进行归一化预处理方法和动态网格方法的一些不足，兼顾了与传统结构特征提取方法的有效结合。3．研究了基于PCA和LDA的手写汉字特征压缩问题，通过特征压缩，使原先的高维特征能够高效地用于实际识别过程，在保证汉字识别率的情况下，特征矢量维数大大降低，使用基于LDA的方法在一定的压缩比率下，汉字识别率也得到了改善。4．金融票据中手写体金融汉字的识别这类问题，属于背景和字形情况都相对复杂的小字符集汉字识别问题，对识别器的区分能力和鲁棒性都有较强的要求。实验表明，使用马氏距离进行分类，通过适当选择参数，可以达到较高的精度，但运算量非常大，难以用于实际系统。本文提出渐进的马氏距离计算方法，并将其应用到金融汉字的识别系统中，在保证识别精度的同时，大大提高了系统的处理速度。在针对实际采集的金融票据中汉字的实验表明，该方法的效果是非常显著的。5．研究面向图像信息检索与图像信息过滤的OCR技术和系统框架，探索传统OCR技术如何更加高效应用，如何与信息检索和信息过滤系统紧密结合，提出基本的解决思路。

其他文献

如何理解信息安全等级保护与分级保护

信息安全保护分级、分区域、分类、分阶段是做好国家信息安全保护应遵循的准则。国家信息安全等级保护与涉密信息系统分级保护是两个既联系又有区别的概念。国家安全信息等级

期刊

国家信息安全公众信息国家秘密信息等级保护分级保护

基于混沌系统的保密通信研究

简要介绍了一般混沌系统的概念和特点，以及其超级状态——超混沌系统与一般混沌系统相比的优点；对混沌保密通信进行了介绍，对目前混沌保密通信技术的研究状况进行了综述；最后对进

期刊

混沌超混沌保密通信

厦门自贸片区：面海而生向海而兴

本报讯用手机登陆APP，报关员凭借一个账号，就能办理国际贸易所涉及的海关、检验检疫、海事等35个部门的业务，“数据跑路”代替了“人员跑腿”，以前报关员窗口排长龙的景象不见了

报纸

基于异或-置乱框架的图像可逆数据隐藏仿真

针对因图像加密、解密过程中图像还原度较差,数据嵌入率较低,导致图像传输过程中图像质量差,安全性低的问题,提出一种基于异或-置乱框架的图像可逆数据隐藏方法。分析相邻像素间位异或-置乱法,使用位异或和像素位置置乱方式对初始图像做加密处理,得到初始加密图像,根据隐藏密钥特征选取一部分像素,利用替换方法把选取像素嵌入隐藏数据中,使用加密密钥将隐藏数据提取出来,最后通过邻域预测方式对加密图像做解密处理,并根

期刊

异或-置乱框架图像可逆数据隐藏图像加密数据隐藏图像解密XOR-scramble frameImage reversible data hidingIm

大学英语教师分布式领导研究

在教育发展变革日益全球一体化的21世纪,教师在世界各国的教育改革中被赋予了越来越重要的角色。自20世纪80年代美、英、澳、加等国先后提出了以"教师领导"作为改进教学、推

学位

分布式领导教师领导教师分布式领导领导型教师教师专业共同体

语文课,朗读吧!

朗读,对语文学习有多重要?我无法确切地衡量。但我可以讲两个跟朗读有关的故事。一天早晨,一年级的小男孩早读儿歌《小宝宝要睡觉》。他读呀读呀,读了很多遍。突然,他问:"为

期刊

金枪鱼

数字集成电路老化故障高精度预测方法仿真

针对传统数字集成电路老化故障预测方法耗时较长、结果误差较大问题,提出一种新的数字集成电路老化故障高精度预测方法。该方法对数字集成电路中存在的信号进行滤波处理,去除噪声信号和冗余信号,分析滤波处理后数字集成电路特征,得到数字集成电路漏电流变化。在此基础上,分析数字集成电路中漏电流变化、阈值电压变化和延迟变化三者之间的关系,进而通过启发式算法完成数字集成电路老化程度的分类,实现数字集成电路老化故障的预

期刊

数字集成电路老化故障预测方法Digital integrated circuitAging failurePrediction method

心脉隆对缺血性心肌病心衰患者疗效及对心功能、运动耐量的影响的研究

目的：探讨心脉隆注射液在缺血性心肌病患者心衰治疗中的疗效及对心功能、运动耐量的影响。方法：160例缺血性心肌病患者随机分为治疗组及对照组,各80例;其中治疗组按EF是否〈35%

期刊

心力衰竭缺血性心肌病B型钠尿肽心脉隆左室舒张末期内径左室射血分数Heart failureIschaemic cardiomyopathyBtype

情景教学在儿童艺术教育中的应用分析

随着儿童艺术教育的不断推进,其重要性不言而喻。如何在儿童早期教育阶段更好的开展儿童艺术教育,成为当前教师们面临的主要课题,基于此情况下,本文主要以儿童艺术教育为研究

期刊

情景教学儿童艺术应用分析艺术教育

护理干预对老年高血压患者的作用分析

对老年高血压患者进行护理干预,对于延缓病情的发展甚至消除疾病,均具有重要的意义。本文以下就主要对心理护理、饮食护理、运动护理、用药护理及健康指导等护理干预措施在促

期刊

老年高血压护理

特定领域OCR系统的精度与速度问题研究

与本文相关的学术论文