联机手写汉字特征合并与相似字区分算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:cattlecattle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前在模式识别研究领域中联机手写体汉字识别已经成为一个非常重要的研究热点。联机手写体汉字识别系统在笔输入计算机方面已有较为广泛的应用。它符合人的自然手写习惯,能从根本上解决输入慢和操作繁琐等问题,因而具有非常广阔的应用前景。但是手写汉字变形大以及手写方式不固定等问题,现有的识别技术还存在相当多的问题,识别系统性能有待进一步提高。针对联机手写汉字笔迹存在的各种噪声,详细介绍了预处理各阶段具体工作,并给出相应的处理算法;提出了一种基于有限状态机的笔段合并算法。在预处理完成后,为了将提取的笔段更好地拟合为标准笔划,该算法根据连续笔段的状态对提取的笔段进行合并。分析了造成相似字误识的主要原因,提出了一种新的相似字区分算法——基于支持向量机的部分空间法。该算法能自动判断识别候选字中是否存在相似字、然后提取相似汉字的部分空间特征,利用支持向量机良好的分类能力,对相似字进行区分。以C++作为模型系统的编程语言,在Windows系统下实现了系统原型。测试结果表明,良好的预处理算法能够有效地消除噪声,为后续特征提取打好基础,有助于提高系统识别性能;笔段合并算法能有效地合并提取出来的汉字笔段,将汉字的结构特征很好地描述出来;相似字区分算法利用不同的部分空间特征和支持向量机,能够有效地区分相似字,达到了预期目标。
其他文献
随着互联网的发展,人们越来越易于在网络上分享多媒体,则不可避免地会有一些暴力多媒体信息流入网络,对于未成年等特定人群来说,这些信息会对他们的行为习惯产生严重的负面影
在线社交网站是web2.0时代的标志性产物,它改变了人们的生活方式,数以千万的用户在社交网站上联络好友、分享动态、参与活动。社交网站提供基本资料页面供注册用户填写,如性
网格技术将地理上分布、系统异构的多种资源(包括计算资源、存储资源、带宽资源、软件资源等)通过高速网络连接起来,为用户提供一体化的信息和应用服务,并且获得对复杂问题的
在常用的信息管理系统的开发模式中,B/S模式和C/S模式都存在着优缺点。结合C/S和B/S两种模式的优点,在系统开发中引入一个混合型的开发模式能够更好地满足用户和企业的要求。
网络技术的快速发展使得互联网上的信息呈现爆炸式的增长。为了有效地利用和管理海量信息,基于内容的信息检索和数据挖掘逐渐成为备受关注的领域。文本分类技术TC(Text Categ
创建逼真的三维人脸模型是计算机图形学领域一个极富有挑战性的课题。随着虚拟现实、影视制作、游戏娱乐互动的发展,这一研究领域也越来越受到人们的关注。本文从事网络游戏
计算机和互联网技术的快速发展和推广,就像一把双刃剑,它一方面给人们的生活带来了极大的便利,另一方面,也给一些不法分子提供了犯罪的温床。人们在越来越多地用计算机来进行
随着大规模网络应用的不断出现,数据存储的重要性越来越大。由于传统存储技术DAS的广泛采用,使得数据分散到各个服务器上,并且服务器大多都工作在不同的操作系统平台上(比如H
大量实时系统作为安全关键实时系统的核心在运行着。在攻击、错误和失效影响下,系统已经不能保持完整的正常工作能力,生存性研究的目的就是保存受危害的信息,维护重要和关键
随着计算机、多媒体和数据通信技术的高速发展,视频压缩技术得到了极大发展,并在多媒体等多个领域得到了广泛的应用。针对不同的应用,国际上制定了很多相应的视频编码标准,H.264/