论文部分内容阅读
本文研究和实现了对图片中的印刷体大小写英文字母和数字的自动识别。在系统的设计中,本文引入了神经网络模式识别技术,提出了一套基于BP神经网络的字符识别系统的设计方案。本文把整个系统分成了三个主要模块(预处理、特征提取和初分类以及基于BP网络的字符分类器)进行详细的阐述。为了提高系统的性能,尽可能的降低误识率和拒识率,本文仔细分析了在三个模块的设计过程中遇到的重点和难点问题,分别提出了下面的解决方案:1.在预处理模块的设计中,本文结合了多种图像处理技术,提出了包括去除离散杂点噪声、倾斜调整和字符分割算法在内的一系列预处理算法,取得了不错的效果,为下面对字符特征提取打下了坚实的基础。2.字符的特征提取是系统设计的重点和难点,关系到整个设计方案的成败。本文在比较研究了几种常用的特征提取方法后,提出了一种基于字符骨架中封闭曲线特征和纵向线条特征的两级初分类算法,将原来含有62个元素的待识别字符集比较平均的分成了三个子集,降低了后续处理的难度。在特征提取方面,本文提出了一种结合字符粗网格特征和规一化投影特征的混合提取算法,很好的兼顾了字符总体特征和局部特征,并利用规一化体现出大小写英文字母在个体大小上的差异,为分辨大小写英文字母中形似字符提供了依据。3.在基于BP网络的字符分类器的设计过程中,本文参考了前人的研究成果,认真研究了包括网络结构设计,参数设计,网络训练和网络识别在内的BP网络设计上的关键性问题,给出了一套优化BP网络性能网络设计方案,并在最后的试验中验证了优化方案的有效性。本文的研究表明,基于BP神经网络的字符识别系统不仅可以高效的识别与训练样本字体相同的字符,还可以对其他字体字符进行有效识别,同时具有一定的抗干扰和形变的能力。本文的设计方案不仅对提高OCR系统的性能有一定的参考、借鉴价值,还可以很好的应用于与字符识别相关的其他领域。