基于Gabor特征与SVM的汉字识别系统研究与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wx0020
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字识别系统是将图像数据中的文字信息提取出来的一种系统。根据图像数据的种类,汉字识别系统有着各种各样广泛的应用。比如银行单据识别,电子图书馆,邮政编码自动分类,手写输入法等。自从计算机问世以来,对于汉字识别算法的研究就一直是学术研究的热点。总体说来,分为基于统计信息的方法和基于文法规则的方法。在统计的方法中,人们利用图像特征对图像进行分类。经过很多人几十年的研究,Gabor特征在众多可选的特征中脱颖而出,成为材质识别,人脸识别,文字识别等方面最重要的一种特征。作为小波分析的一种方法,Gabor特征比较符合人类视觉的形成原理,具有良好的生物学背景,因而非常适合解决材质识别之类的问题。在分类器的使用上,20世纪90年代出现的支持向量机(SVM)一经推出就备受关注,一直是分类研究最活跃的领域。因为SVM对小样本数据的学习与分类具有很好的效果,对于训练样例不足够多的情况,SVM是很好的选择。本文将这两个工具结合起来,研究各种识别技术下,汉字识别的准确率与识别率情况。在汉字识别系统的基本框架下,本文首先利用二值化聚类法提取出图像中的文本区域,然后将Gabor特征与SVM用于汉字识别技术,实验了各种情况下的汉字识别效率与准确度。通过自动生成的大量训练样例对该系统的训练,系统的识别率和准确率有了较大的提高,实验证明,该方法取得了很好的效果。
其他文献
软件演化在软件生命周期中必不可少,当前体系结构的运行时动态演化已经成为许多软件系统的根本需求,而支持动态体系结构的运行平台以及实现框架是其中的关键问题。另外,当前
随着World Wide Web的飞速发展,Deep Web中蕴含了海量的可供访问的信息,并且还在迅速的增长。这些信息要通过查询接口在线访问其后端的Web数据库得到。尽管丰富的信息蕴藏在D
计算机网络是把分布在不同地理区域的计算机,通过通信线路互连成一个规模大、功能强的网络系统,从而可以方便的互相传递信息,共享硬件、软件、数据信息资源。家庭宽带接入业
近年来,我国进入人口老龄化迅速发展时期,老年人口呈现总量扩张、增量提速的发展态势。面对日益加剧的人口老龄化现象,长远的计划安排和积极的战略应对是必不可少的。在老年人中,听力损失患病率非常高,是仅次于关节炎和高血压的常见慢性疾病,并随着年龄增长发病率逐渐升高。因此在积极应对人口老龄化,大力发展老龄服务事业和产业的过程中,老年人的听力损失是一项值得引起我们重点关注的问题。听觉器官老化属于自然规律,目前
本课题以协同工作平台服务系统(CWPS)的研究开发为背景,以分布式对象计算技术思想为指导,结合面向对象/面向构件的方法论,提出了共享接口网关软件模型。运用设计模式等软件体
壳的出现,使软件保护进入了一个新的时代。加壳技术已广泛应用于软件保护,在软件逆向分析、软件解密和恶意软件检测等过程中,软件脱壳已成为十分重要的环节之一。软件壳检测
视频监视系统是安全防范系统的重要组成部分,它是一种防范能力以及实用性都很强的综合系统。然而近年来,随着嵌入式技术、多媒体技术、计算机网络等的快速发展,视频监视系统
2G移动网络为了实现交换与控制的分离,引入移动智能网作为增值业务的开发与运行平台,而3G移动网络为了提供更为开放的业务开发模式,引入应用服务器作为主要的电信业务运行平
调度问题是工农业生产、国防、科研、交通运输以及各种服务行业中普遍遇到的问题。调度问题要研究的主要内容就是根据产品制造需求合理分配产品制造资源,进而达到合理利用产品
对连续语音语料库进行切分或标注是整个连续语音识别系统的基础和前提,而且也是一项非常重要的工作,因为它对语料库的充分利用有重要作用,对连续语音识别系统的性能有重要影