论文部分内容阅读
随着计算机的诞生和信息技术的飞速发展,字符识别的内涵已经由最初的一种阅读辅助工具发展成为一种处理数据和信息的重要手段,得到了极为广泛的应用。手写数字识别作为光学字符识别的一个分支,到目前为止还没有得到令人满意的解决方案。本文以主分量分析法和多分类器组合法为基础,主要对手写数字识别技术中的图像预处理、特征提取和分类器设计进行了研究。
手写数字图像预处理包括:二值化、数字串分割、字符的倾斜校正和归一化。论文讨论了能够有效的确定图像二值化过程中的灰度阈值的灰度直方图法;介绍了通过谷点搜索算法来确定分割点实现数字串分割的垂直投影法;分析了能够对倾斜角度小于直角的字符进行有效校正的递归倾斜校正法;研究了字符的位置归一化、大小归一化和笔划粗细归一化,其中笔划粗细归一化以数学形态学为基础,通过先后对字符进行骨骼化和膨胀运算来实现。
手写数字特征包括:主分量特征、字符高宽比特征和欧拉特征。不同类型的特征表现了数字字符不同方面的特性。研究表明:主分量特征描述了数字字符结构特征的统计信息,特征向量的维数可通过数字类的重构均方差或协方差矩阵的特征值来确定;倾斜校正后数字字符的高宽比特征可有效的将数字“1”和其它数字分开;欧拉特征体现了手写数字的拓扑特性,可有效的将数字“3”和“8”区分开。论文还应用Parzen 窗函数法和最大似然法对每个数字类高宽比特征的概率密度进行了估计。
手写数字分类器包括:单个分类器和组合分类器。文章介绍了以贝叶斯决策规则为核心的贝叶斯分类器,其适用于特征维数较低且概率密度容易估计的情况;研究了识别率可达到87.90%的最小重构偏差分类器,该分类器与主分量分析相对应;分析了具有良好非线性映射能力的三层前馈神经网络分类器,其分类性能与隐层单元个数和训练终止误差有着密切的关系;提出了多分类器组合的原则和方法。组合原则的中心问题是当参与组合的成员分类器出现不一致时,如何解决这种冲突。对于同种类型的分类器组合方法有投票法和线性组合法,正确识别率可达87.73%;对于不同类型的分类器组合方法为乘法,正确识别率可达90.73%。同时,探讨了对类别属性不明确的数字采取拒绝分类的方法,该方法能够满足实际应用中对高识别精度的要求。