论文部分内容阅读
手写字符识别是模式识别理论的一个重要应用领域,也是实现在各种背景下字符录入自动化的重要手段.特征提取和分类器设计是手写字符识别中的两个关键技术.虽然手写字符识别研究已经取得了很大进展,但在这两个方面仍存在尚待深入研究的课题.本文就围绕这两个关键技术,提出了新的方法.在特征提取方面,提出了基于梯度归一化的梯度特征提取.首先得到原图像的梯度信息,然后基于归一化函数得到归一化的梯度信息,最后基于归一化的梯度信息提取梯度特征.在预分类方面,提出了基于广义可信度阈值判别的预分类规则.给出了"基于后验概率阈值判别的预分类规则能够获得错误率和平均候选类别数的最优折衷"这定理的证明.依据广义可信度的定义,得到了"基于广义可信度阈值判别的预分类规则能够获得错误率和平均候选类别数的最优折衷"的推论.在提高分类器性能方面,提出了基于最小分类错误准则的街区距离判别函数.从增加原型数和优化判别函数两个方面,提高了街区距离判别函数的预分类性能.针对多原型问题,提出了基于快速κ-均值聚类算法的多原型学习;针对判别函数优化问题,分析了最大似然估计的不足,给出了基于最小分类错误准则的多原型街区距离判别函数优化算法.使用基于广义可信度-Ⅰ-阈值判别的预分类规则和P<,e>-N<->曲线比较了基于最小分类错误准则的街区距离判别函数和基于最大似然估计的街区距离判别函数的预分类性能,结果表明,前者的预分类性能优于后者的预分类性能.在识别方法方面,提出了主动判别函数.通过类别学习样本获得了类别主动原型模板的先验知识;类别主动原型模板根据先验知识"适度"的改变,使其与待识字符的距离最近,而相应的主动原型模板就是最优主动原型模板.将这最近距离作为待识字符与类别主子空间的距离;为了充分利用类别次子空间中的分类信息,还定义了待识字符与类别次子空间的距离.最终,将主动判别函数定义为待识字符与类别主子空间距离和次子空间距离的加权和.提出基于最小分类错误准则优化主动判别函数并给出了相应的优化算法.使用基于广义可信度阈值判别的预分类规则,并将优化后的主动判别函数与优化后的街区距离判别函数相结合,建立了完整的识别系统.