高鲁棒性的字符识别技术研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:flash021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符识别技术在印刷文本识别等领域已经取得了很大的成功,并得到了广泛的应用。构造高鲁棒性的识别系统一直是字符识别研究追求的目标,在过去的研究工作中,主要是针对二值文本图像中的字体、字号变化或者图像噪声等进行研究;而随着研究的进步,低质量灰度图像中的字符识别以及脱机手写字符识别已经成为了字符识别问题中最具挑战性的前沿领域,相应的,鲁棒性的涵义也必须从较高质量的文本识别领域拓宽到这些领域中,以更好的适应图像干扰和字符形变。本文从高性能特征抽取和分类器设计等方面对相关问题进行了研究,主要的创新研究工作为: (一)对于低质量灰度图像中的字符识别,本文提出了直接在灰度图像中抽取识别特征的思路,从而避免了图像二值化过程中可能产生的信息损失;在人类视觉原理及信号处理理论的指导下,提出了应用二维Gabor滤波器组直接在低质量灰度字符图像中抽取识别特征的方法。 (二)本文总结了低质量图像的特点,并对汉字字符笔画的特点进行了统计分析;在此基础上,通过考察Gabor滤波器对不同宽度和方向的线条信号的选择特性,采用平均的熵相关系数准则提出了Gabor滤波器组的优化设计方法。(三)本文还提出了对Gabor滤波器组的输出进行自适应处理的方法,使之适应图像亮度变化,抑制噪声和干扰;同时还提出了一种新的特征构造方法-特征矢量中包括了分别利用Gabor滤波器实部输出的正、负值形成的特征分量,实验表明它在识别性能上优于现有的方法。 (四)本文进一步将基于Gabor滤波器组抽取特征的思想应用于HMM模型中,并通过实验证明了本文提出的观测序列抽取方法的优越性;结合脱机手写汉字识别问题的特点,本文对HMM模型的拓扑结构选择,以及克服经典HMM模型中齐次性假设和观测独立性假设的方法进行了研究探讨。对脱机手写汉字样本集的识别实验证明了基于Gabor特征的HMM模型应用于大字符集的脱机手写字符识别的价值。 本文得到的Gabor特征对于图像的亮度变化、噪声、复杂的背景干扰以及字符倾斜、形变等具有优秀的适应能力,降低了对图像增强等预处理过程的要求,具有很大的通用性,在实际应用,如自然景物图像中的文字识别系统,汽车牌照识别系统,身份证识别系统等项目表现出了优异的性能。
其他文献
本文通过对荣华二采区10
期刊
学位
摘要:“一师一优课、一课一名师”(即晒课)活动自开展以来,在全国各地区开展的如火如荼,已成为资源融合、智慧分享、风采展示的良好平台。笔者以自身在一次“晒课”活动中所学所感,结合在平时的教学工作中经验,对“晒课”在实际教学活动中的影响进行了思考总结,并对晒课活动提出改进建议,可为“晒课”活动的开展提供借鉴和指导。  关键词:“晒课”;教学思考; “晒课”建议  一 、引言  教育部为贯彻落实党提出的
水下激光通信中,空基系统一般采用扫描的方式对水下接收端进行通信。要想减少扫描时间,提高扫描命中概率,扫描光斑越大越好。但是激光器功率是一定的,光斑越大,其能量密度越
随着INTERNET迅猛发展,IP已成为用户端的主要通信协议,成为综合数据通信业务的最佳选择.由于INTERNET用户的增多和接入信息量的递增,对远程主干网络的带宽有了更高的要求.过
在国家自然科学基金(项目号69983005)的资助下,该文对解决该问题的有效途径进行了有益的探索.通过研究主动网的发展动因和技术优势、它的体系结构、实现方法、当前几种有代表
该论文探讨了一种基于边界流的新颖的边界检测方案.这种方案利用一种预编码模型来鉴别各图像点在给定尺度下的色彩或纹理变化方向,并生成一个边界流矢量.通过传播这些边界流
该论文独立完成了运行于局域网(LAN)环境中的一台多功能测试仪 SCT-1中通信模块软硬件的设计与实现.该项目应用RT8019AS以太网控制器,以8位微处理器WINBOND 77E58为工作平台.
十九大报告指出,农业农村农民问题是关系国计民生的根本性问题,必须始终把解决好“三农”问题作为全党工作的重中之重,实施乡村振兴战略.中央把“三农”问题列为工作的重中之
期刊
自2002年十五届中纪委第七次全会提出实行经营性土地使用权出让招标拍卖、建设工程项目公开招标投标、政府采购、产权交易进入市场等四项制度以来,中国产权交易资本市场已在
期刊