基于支撑向量机的手写英文字符识别

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zouyuefu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写字符识别是OCR的一个分支,它的研究对象是:如何利用电子计算机自动辨认手写的英文字符和阿拉伯数字。在探索手写字符识别的方法上采用了统计学习理论,利用支撑向量机SVM作为基本的识别工具。 统计学习理论是一种研究基于样本的机器学习理论。V.Vapnik等人从六、七十年代开始致力于此方面的研究,到九十年的中期,其理论的不断发展和成熟,已基本形成一套比较完整的理论体系。在这一理论基础上发展了一种新的通用学习方法一支撑向量机SVM。它是一种普遍适用的方法,已经广泛的用于模式识别、回归估计、函数逼近、密度估计等方面。独立分量分析ICA最初是由Comon等人于1994年提出的,它解决了盲源分离等问题,应用于模式识别、图像、医学等领域。本文在系统研究SVM和ICA的基础上提出了以下新的观点: 其一是采用了引入后验概率的修正SVM方法,它在原分类超平面的基础上不断修正分类超平面,提高分类正确率,从而避免了寻找最优二次规划的麻烦,同时将大规模训练样本集化为小规模训练样本集; 其二是应用独立分量分析ICA对需要进行识别的字符图像预处理,提取字符特征,降低输入数据的维数,从而可以为下一步的SVM识别过程提供好的数据集,用以提高识别率和识别速度。 结合以上两种新方法,使得识别率和识别速度有明显的提高。ICA方法的引入对于识别过程无论在速度上还是在正确率上都有很大的提高,其中的根本原因在于对输入数据维数的压缩;修正SVM方法是对原有SVM方法的一个改进,借助于特征压缩后的数据集,识别效率有了很大的改善。
其他文献
由于视频数据的大信息量和有限的传输带宽,使得视频的压缩编码、传输信道和网络协议的选择成为视频传输应用中的关键技术。本文研究了一个基于局域网的视频传输系统,目的是适应
该文针对现有虚拟大学中的不足,提出了自己的解决方案:设计了一个面向虚拟大学的移动agent协作中间件系统模型(VUMAM)以及基于该模型的虚拟大学的系统框架,并对该系统中的age
软件的再工程可以帮助更好的理解和复用遗产系统,它是提高遗产系统质量和可维护性、提取可复用构件的良好途径.国内外在这方面已经开展了许多研究,取得了一些成果,同时也产生
联邦数据库系统可以解决各个成员数据库系统的数据模型和数据表达的异构,以及语义异构等问题,它从传统的集中式数据库系统的三层模式结构扩展到五层模式的体系结构,提供了异构数
该文提出了一种完整的网络信息集成系统实现方案.网络信息集成系统中的包装器包含访问数据源查询接口的SIDL模块及抽取结构化数据的抽取器模块,目前大多数研究都只讨论了其中
该文就粗糙集理论及其在数据挖掘中的应用进行了较为深入系统的研究.完成的工作和取得的成果在于:提出了在Ziarko变精度粗糙集模型基础上的一种基于分类正确度的粗糙集模型,
由于软件规模和复杂性的增加,软件测试技术研究和工具开发滞后,软件测试中存在大量的手工劳动,从而使得软件测试的效率很低,费用很高.而且,由于软件测试仍然是目前和今后相当
如今,随着计算机硬件以及网络技术的发展,并发程序在提高计算效率上发挥着越来越重要的作用。然而编写高质量的并发程序对于程序员而言并不是一件简单的事。与此同时,并发程序的
该文首先介绍了课题的相关技术,包括.NET框架技术、传输媒介和传输协议的选择、.NET Pemoting技术及多媒体数据处理技术等.接下来讨论平台实现方案和实现过程,论述了平台结构
网络化钻井技术是目前石油钻井信息化研究的一个重要方面,现有网络化钻井软件支撑平台在支持石油钻井应用软件共享和进行异地实时操作中存在对已有钻井软件利用率低,进行协同