汉字笔迹的笔划提取

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:forevil666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多媒体信息量飞速增长的今天,从包含有汉字信息的图片、视频等媒介中,进行汉字笔迹的自动识别,成为目前研究的热点。笔划提取是汉字笔迹识别的一个重要步骤。由于手写汉字具有字量大、书写风格众多、随意性较大和结构复杂等特点,所以,目前笔划提取还存在许多技术问题,包括汉字分割、细化和笔划提取等问题,需要进一步研究。在对汉字书写的特点以及已有的分割方法进行分析的基础上,设计了用密度聚类来分割汉字的方法。聚类方法以组成汉字的像素点为研究对象,聚类完成后得到的簇就是分割出来的汉字。实验结果表明,用聚类方法可以有效地解决汉字粘连等问题。针对现有的细化算法不能解决细化过程带来的局部结构变形和“伪分支”的问题,对通用细化算法进行了改进,增加了一些排除规则。实验结果表明,在改进后算法的效果要比以前好,能够有效地解决原算法存在的结构变形和伪分支等问题。另外,对轮廓跟踪细化算法作了分析,针对起始点难以确定和跟踪过程复杂的问题,给出了确定跟踪起始点的方法,并解决了跟踪过程中存在的一些问题。实验结果表明,轮廓跟踪细化算法能够克服局部结构的变形和“伪分支”问题。在笔划提取上,通过分析细化后骨架的交叉点与模糊区域的关系,设计了合并交叉点并寻找离交叉点最近距离的轮廓点来检测模糊区域的方法。实验结果表明,该方法能够正确地检测出模糊区域。在检测模糊区域后,分析模糊区域附近的笔划间的关系,合并笔划段,最后提取出笔划。
其他文献
专利是人类的知识成果,最大程度的开发利用专利知识,可以为国家和企业缩短时间,节省费用。专利知识抽取,作为深层次理解专利内容的重要基础,日益成为专利研究的热点,直接影响着专利
求解任意给定的两个字符串的最长公共子序列(LCS)的问题是计算机科学中一个基本和重要的问题,它是一种仅仅允许对模式和正文进行插入和删除编辑操作的近似串匹配问题。最长公
随着计算机技术在视频方面应用的发展,让计算机理解视频内容成为现代计算机视觉技术研究的重点。视频场景分割是实现视频语义理解的第一步,也是实现视频数据高效浏览与索引的关
搜索技术是人工智能中的一个基本而重要的研究领域。人工智能所处理的信息通常是不确定的、模糊的、不完整的、海量的,因此一般不能明确地知道问题求解的途径,需要通过搜索求
随着计算机技术、移动通讯技术和互联网技术的迅速发展,计算方式也在不断地变化。而当今新兴的移动式计算环境不同于传统的分布式计算环境,有着鲜明的特点:移动性、网络通信的非
结合我国高等教育自学考试信息化管理的发展现状和自学考试毕业资格审核的特点,从简化毕业生资格审核的复杂度和降低管理人员工作强度的角度出发,研究和开发出一个能满足未来
近年来核心网带宽迅速增长,接入网的发展却很慢,“最后一公里”仍然是高速局域网和核心网之间的瓶颈。由于成本低廉、接入范围广、支持多种业务接入等优势,以太网无源光网络
报表作为一种信息组织和分析的手段,在企业级的信息管理过程中起着不可或缺的作用,内容和形式也呈现多样性。任何企业都需要制作一定数量和格式的报表。在当前的网络已经成为
企业信息化的投资已经成为当今企业管理的一个严峻问题。一方面,企业信息化规模的增大促使其逐渐成为提高企业价值和发展潜力、提高企业核心竞争能力的有效手段和途径。另一方
广域网下充斥着大量复杂的数据和大量复杂的用户访问行为。传统的网络文件系统一般采用中心化的文件系统服务器,可扩展性差,导致局部出现性能瓶颈。另一方面,广域网中存在大