基于稀疏表示的脱机手写体汉字识别研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:zxpwode10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机手写体汉字识别是模式识别领域的一个研究热点,应用前景非常广泛。但由于汉字类别多且字形结构复杂,加上不同的人书写风格的不同使得手写体汉字的变形很大,所以脱机手写体体汉字识别一直是目前文字识别领域的难题之一。   因为汉字具有图像的特征,所以图像处理的一些方法在汉字处理中也可以引用。本文通过对图像和汉字的可类比性进行分析研究,对目前广泛采用的一些脱机手写体汉字识别算法和前人的研究工作进行了认真的学习和总结。在此基础上,把目前用于图像识别的Group Lasso算法应用于脱机手写体汉字识别上,做了大量的实验研究,提出了一种基于稀疏表示的脱机手写体汉字识别方法,取得了良好的效果。具体做了如下几个方面的工作:   首先,对汉字图像的预处理的各个过程进行了分析,指出了预处理各个环节对提高后续识别过程的影响及重要性。分析了现有两类特征提取方法:统计特征提取法和结构特征提取法各自的适用领域,研究了基于距离、模糊识别、人工神经网络和支持向量机等几种经典的分类器算法。总结这些算法各自的优点和缺点,为寻找新的识别算法打下基础。   其次,针对现有的几种脱机手写体汉字识别经典算法识别率还不是很高这个现实,基于压缩传感理论,根据稀疏表示具有很好的判别性这一特点,提出了利用对手写体汉字进行稀疏表示的方法进行识别的方案,并给出了具体的算法-Group Lasso算法。   最后,针对稀疏表示Group Lasso算法,以SCUT-IRAC手写体汉字数据库中的汉字作为样本,在MATLAB R2009B软件环境下,分别采用本文的方法与其它一些经典算法进行仿真实验。实验结果表明:本方法成功地提高了手写体汉字的识别率和抗干扰能力,具有较高的推广价值。
其他文献
无线多跳网络具有网络自组织、网络拓扑动态变化、多跳性、分布式计算、节点能耗受限和所处网络环境恶劣等特点,所以无线多跳网络设计面临诸多的挑战。尤其是近年来基于无线
近年来,随着无线通信技术的迅速发展,无线通信业务大幅度的增加,人们对无线业务的应用提出了更高的要求。相应的频谱资源的分配问题成为人们关注的焦点。而大部分频谱被分配
近年WCDMA技术快速发展,特别是高速下行分组接入(HSDPA)和高速上行分组接入(HSUPA)技术的应用,基于无线IP网络发展IMS业务逐渐成熟。越来越流行的IM通信业务将通信业务的简化
随着多媒体技术和网络通信技术的发展,视频作为多媒体的最重要模态,已经在工业生产和人们生活得到广泛使用。传统高质量二维平面视频虽能较好的反映客观物体的纹理,但是却不
基音周期作为语音信号处理中描述激励源的重要参数之一,广泛的应用于语音合成、语音编码和语音识别等语音信号处理技术领域。准确可靠地对基音周期进行检测将直接影响整个语
数字集群系统是一种高级专用移动通信系统,它不仅能够提供个人移动通信,还能为用户提供丰富的无线指挥调度等功能,是国内专用数字移动通信重点研究项目之一。目前,国内的城市
随着数字有线电视的普及,知识产权越来越受到重视,另外,数字水印技术的发展,使得以数字水印技术对数字电视监控既具实际意义,也具可行性。通过该平台可以实现对有线电视的监控,达到
随着通信技术的发展,无线通信环境日益复杂,通信信号在很宽的频带上采用了多种调制方式,同时这些信号的调制参数也不完全相同,如何有效的监视和识别这些信号,在军事和民用领域都是
随着高速铁路的快速发展,高铁列车的行车安全成为了越来越受人们关注的热点话题,现有的铁路通信系统GSM-R,已渐渐不能满足日益增长的安全需求,原铁道部(中国铁路总公司)相关
近年来,无线传感器网络在工业监控、环境监测、智能家居、健康医疗等领域获得了广泛应用。随着传感器的感知、存储和计算能力的日益增强,无线传感器网络正朝着异构化、大流量