论文部分内容阅读
随着时代的发展,科学技术日益发达,各国贸易日益密切,由于贸易的密切,从而带动了金融市场繁荣,在各国贸易交往过程必不可少的就是数据,每天处理的数据数量难以计数,如果这些数字用人工来处理,简直难以想象,所以当人们处理这些数据过程中就会想到一个问题,那就是能不能用机器来代替人工操作,这样产生了手写数字的识别这门学科一一模式识别;因为手写体数字识别在贸易市场应用非常广泛,各国在贸易过程都希望有智能化的工具来进行手写数字的识别,各国学者经过很长时间来研究手写数字识别,也取得了很大的成功,提出许多优秀的算法,但是到目前为止,还没有一种算法能准确无误识别手写数字,主要是数字的书法因人而异,各种各样的形状都有。在过去相当长的时间里,各国都经历数据管理非常落后,各种手写数据的识别、数字的打印和归档等工作耗费了大量的人,要求改变这种现状用智能化来管理越来越引起各国重视。手写数字识别是文字识别中的重要研究课题之一,虽然数字的种类只有十种,而且笔划又简单,看起来似乎识别并不是很困难。但是,在实践过程中,通过一些检测结果表明,数字的识别正确率比不上印刷体汉字识别正确率高。手写数字识别的难点主要在于它变体极多,而且对数字识别准确率要求比文字要苛刻得多。例如,在数据中,如果把1识别成7;虽然只有一个数字不同,但是结果完全不同,造成损失很大,所以,研究一种高效的手写数字识别系统是在模式识别占有重要的位置。本篇论文主要是研究单个的手写体数字识别中的一些问题,如数字图像抓摄、特征提取、特征选择、数字识别等研究。数字图像的预处理:数字图像的灰度化、手写数字二值化、手写数字平滑处理、数字图像校正、去除图像干扰部分、数字图像归一化、数字图像细化。本文核心的工作:1.利用SVM对数字进行分类,这样就能够很好的区分各个数字的主要特征,只要抓住了各个数字的主要特征,这样有利于对手写数字的特征提取和特征选择;2.本文对图像的获取采用视频而不是用扫描仪,这样对手写数字的纸张的厚度、颜色和用笔没有特殊的要求,在利用视频进行抓拍图像时,我们采取了基于VFW的软件开发包,由于这个开发包在图像、音频方面应用得非常广泛,它封装了大量的视频的库函数,我们在编写程序,只要了解各库函数的用途就可以,不要了解个函数的具体实现过程。3.在得到了视频抓拍的图像,我们就要对它进行预处理,预处理的目的就是得到清晰图片,这样有利于获得该数字的主要特征,为提高获得数字识别率;4.建立基于图像技术对手写体数字进行识别,采用模板匹配算法。通过实验表明,对2,3,5,8,字符准确识别,而对1,7,0,6,4,9,数字基本识别无误,该方法提高了对数字识别率和实时性。