论文部分内容阅读
作为字符识别的一个重要研究分支,手写数字识别在大规模数据统计、财务、税务、金融以及邮件分拣等领域具有广泛的应用。手写数字识别的应用领域要求识别的结果不允许有任何误差。虽然只有10个数字,由于数字书写随意,有明显的区域特性,再加上不能借助上下文的关系,导致手写数字识别的研究更具有挑战性。为实现高效、快速的手写数字识别,本文首先基于逐像素特征建立了手写数字识别模型。通过实验验证分析,发现基于逐像素特征的识别模型对存在笔画粘连缺失、多余笔画信息、字符倾斜等三种缺陷的手写数字图像识别性能较差,不能很好地将相似字符对区分开来。为弥补逐像素特征识别模型的不足,在分析逐像素特征识别模型的误识样本图像的基础上,提出一种新的结构特征——凹线特征。由于凹线特征具有描述手写数字轮廓凹线的形态及位置的能力,因此对字符细微结构差异敏感。提高了“相似字符对”分类的准确度。实验结果表明,凹线特征虽然具有解决“三缺陷”图像“相似字符对”的分类能力,然而,由于凹线特征提取的仅为数字字符的局部信息,不能解决数字字符轮廓曲线出现噪声干扰的问题,对存在“笔画断裂”“笔画噪声”等问题的图像不能很好地识别。为弥补凹线特征的不足,在分析逐像素特征识别模型误识样本图像的基础上,又提出一种新的统计特征——旋转投影特征。旋转投影特征提取数字字符各个方向上的投影值,能够体现数字字符笔画密度分布情况,解决了凹线特征随字符轮廓噪声干扰而变化的问题。实验结果表明,旋转投影特征虽然具有解决带有轮廓噪声干扰的手写数字图像识别的能力,然而,数字字符细微结构的变化严重影响投影值,因此,旋转投影特征识别模型不能很好地识别有细微结构变化的手写数字。考虑到逐像素特征、凹线特征、旋转投影特征的互补特性,将分别基于三种特征的识别模型通过基于先验知识的加权投票融合算法进行融合,构成手写数字识别系统。实验结果表明,系统在一定程度上提高了相似字符对的识别率,从而实现了整体识别率的