一种改进的支持向量机在手写体汉字识别中的研究与应用

来源 :湖南大学 | 被引量 : 0次 | 上传用户:lovelevin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式识别是一种人工智能信息处理技术,在近年来广泛应用于文字、指纹和遥感图像识别等领域。模式识别大致分为三个过程:预处理、特征提取、识别。预处理完成的是前期工作,对获取的待识别图像进行二值化、平滑、细化等图像规范化操作使得更易进行下步的识别操作。特征提取过程将输入对象的识别特征作为特征空间的一个点或一个特征矢量提取出来。识别完成最后的分类,这个过程将前面提取出来的特征矢量用分类器进行分类,通过决策函数得到最后的分类结果。本文主要研究的是识别过程中近年来应用较为广泛的一种分类器:支持向量机(SVM)。支持向量机是在统计学习理论的基础上发展而来的一种机器学习方法,在解决小样本、非线性及高维模式识别问题中表现出了许多特有的优势,但是传统的SVM存在很多亟待解决的问题:1)SVM核函数及其参数的选择没有固定的标准;2)SVM只能解决二类样本问题,无法解决实际情况中的多类分类问题。遗传算法(GA)是一种搜索寻优算法,摒弃了传统优化方法的搜索方式,模拟自然界生物进化过程,采用人工进化的方式对目标空间进行随机化搜索。遗传算法对求解问题本身一无所知,所需要的仅是对算法产生的每个个体进行评价,通过作用于个体上的基因,寻找更好的个体来求解问题。遗传算法这种进化搜索的优点,能在多代搜索中寻求最适合的SVM核函数参数,较好的解决了SVM参数没有固定标准的问题。同时,将SVM用正态树形层次集成起来,进行多次二类分类,从而达到多类分类的目的。汉字识别是用计算机自动辨识印刷在纸上或人写在纸上的汉字,学科上属于模式识别和人工智能的范畴。在当今信息发展一日千里的时代,越来越多时候面临将手写文字录入计算机系统处理的需要,这就迫使手写字符识别成为一个亟待解决的问题。本文结合遗传算法和正态二叉树改进支持向量机构成GA-SVMs,将这种改进的支持向量机应用在手写体汉字识别上,开发出一套手写体汉字识别系统。GA-SVMs摒弃了传统的SVM参数不确定的缺陷,能快速的搜寻最优SVM,在分类正确率上有一定的提高,同时改进了传统SVM只能二类识别的不足。实验证明,GA-SVMs对整个识别功能及结果来说有较好的表现,对传统的SVM有较好的改进。
其他文献
随着无线传感器网络在各个领域的广泛应用,其面临的安全威胁也日益严重。然而传感器节点的存储空间、计算能力、通信带宽等资源严重受限,传感器网络特殊的部署环境、开放的无
随着计算机网络技术和通信技术的相互融合,以这两项技术为基础的计算机支持协同工作(Computer Supported Cooperative Work,CSCW)技术,得到了快速的发展。传统的协同架构,广
无线传感器网络是目前信息领域里一个重要的研究热点,已在多个方面得到广泛应用,如:国防军事,航空航天、环境监测、交通医疗、反恐抗灾等方面,在未来也具有很好的发展和应用前
研究生信息管理系统是实现研究生教育管理的重要组成部分,是研究生教育信息化程度的重要标志,对提高研究生教育管理水平、节约人力资源、实现信息资源共享,实施科学管理起到重要
随着实时CORBA(Common Object Request Broker Archi tecture,通用对象请求代理体系结构)技术的日趋完善及应用的需求,越来越多的分布式实时系统建立于其之上。在分布式实时系
随着计算机技术的发展,计算机安全事件频繁发生。计算机取证(computer forensics)正是在这种形势下产生和发展的,它可以对犯罪分子产生威慑作用。当前,分布式拒绝服务攻击(DD
应用数据挖掘技术,加强税收数据进行分析,为税务系统强化科学管理提供有价值的决策信息,已经成为当前税务系统的一个研究热点。本文针对当前税收执法管理工作中存在的不足,结合税
随着科学技术的发展,全球信息化时代的全面到来,数字化科技将为未来社会建立起“数字世界新秩序”,数字化信息将成为人类社会的重要支柱之一。在数字全球化的大环境下,传统的档案
随着计算机网络技术和计算机通信技术的迅猛发展,使人们对网络上提供的高质量视频/音频等多媒体服务的需求越来越大。以视频点播(VOD)为核心的各种网络应用和信息服务将成为人们
随着多媒体技术和网络技术的发展,多媒体信息的机密性和真实性越来越受到人们的重视。但是在对数据进行保护的时候往往却忽略了多媒体数据本身的特点,如文件格式、码流结构、