论文部分内容阅读
手写数字识别具有广泛的应用前景,很多学者对此做了大量的研究,提出了很多预处理和模式识别的算法,大大提高了手写数字的识别精度。但手写数字识别的识别精度和识别速度问题仍妨碍着数字识别技术的广泛应用。围绕这一课题,本文主要对Gabor特征提取、特征选择及基于支持向量机分类器设计、手写体数字识别系统四个方面进行了研究。
本文研究了Gabor滤波器的特性,它比较准确的描述人脑视觉皮层简单细胞的感受野,从而能有效的提取图像特征。针对Gabor小波特征提取后的维数较高,采用线性判别分析进行特征选择降维。现行判别分析寻找在最小均方意义下最能够区分各类数据的投影方法。支持向量机(SVM)是由Vapnik于1995年提出的针对分类和回归问题的统计学习理论,它在高维特征空间使用线性函数假设空间的学习系统,较好的解决了维数灾难和过学习等问题。在实际应用中,SVM由于支持向量较多,导致训练时间很长;同时算法参数选择多根据反复试算得到,没有一定理论依据。针对这些问题,本文采用基于一种二合一方法的支持向量修剪技术,当支持向量数超过给定阈值的时候将进行高效的支持向量修剪以实现提高算法速度、降低内存占用。本文使用的支持向量机训练策略包含两个参数C和σ,对固定的σ,较大C参数的可行域包含较小C参数的可行域,所以可以把较小C参数的解作为较大C参数的迭代初始值以加快算法的收敛速度。在此基础上,通过扫描一定范围内的所有C和σ的组合了获得最优参数组合。通过对MNIST手写数据库进行实验,最高识别率达到99.34%,训练时间为1243秒(Table5.1);对UCI手写库实验最高识别率达到98.21%,训练用时359秒(Table5.1)。实验结果验证本文提出方案的有效性。