论文部分内容阅读
随着当今社会的日新月异及信息化进程的快速发展,我们如今正被数字化时代笼罩着,数字正朝着庖代我们对话语和文字的语言表达、记忆的方向进展。身份证号码、驾驶证号码、手机号码、体检表中一系列表达出身份、能力、对象和健康质量的数字信息表示,都需要用电流+网络+程序解读的阿拉伯数字:1、2、3、4、5、6、7、8、9、0的组合来表达。所以,想要使目下的数字信息化时代能在安全的基础上得以高效的发展,并以此来达到我们高品质的生活质量,使用安全高效的智能方法或技术精密的数字识别成为亟待解决的重要问题。许多研究人员努力把各种新的知识应用至预处理、特征提取、分类之中,比如:神经网络学、数学形态学等等。系统应用的性能关键及其发展瓶颈依然出在数字识别核心算法性能方面,其终极目标为研究零误识率抑或低拒识率的高速识别算法。本文通过对数字识别产生的背景、实用价值、国内外研究现状及发展趋势、现实意义等的分析,设计了基于Gabor变换和改进不变矩印刷体数字特征提取方法,并分别设计了基于Adaboost算法和神经网络的数字分类器,具体完成的工作如下:(1)对印刷体数字识别系统的研究背景及意义、国内外研究现状进行了分析论证,并确立了本论文的研究内容;(2)分析比较了Hu不变矩及其各种改进不变矩算法,采用Hu矩和四种改进的不变矩对印刷体数字图像进行特征提取,并设计了神经网络分类器,在MATLAB环境下进行了仿真实验,表明各种不同的改进不变矩算法较普通Hu矩识别率有一定的提高;(3)采用主成分分析法对印刷体数字图像进行了特征提取,并设计了3-近邻法分类器,通过仿真实验表明在主元个数选择适当时,该方法识别率达到92%;(4)Gabor变换是一种较好的时频分析方法,本文利用Gabor对印刷体数字图像提取各个尺度和方向的频域信息,并引入下采样操作,得到了表征印刷体数字图像的频域特征向量,在此基础上,引入PCA变换进行二次降维,并设计了Adaboost分类器,结合PCA和Adaboost算法特点,论文设计三种方案,通过仿真实验表明,这三种方案均取得了较好的识别率。(5)对论文进行了总结分析,并对下一步工作进行了展望。