手写体汉字的合成方法研究

被引量 : 0次 | 上传用户:javajava2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写体汉字识别和生成一直是模式识别领域的一大难题,对手写体汉字识别的研究有助于提出解决模式识别一些基本问题的方法,手写体汉字生成的研究则有助于手写体识别的研究。用生成的手写体字符可以为机器学习、模式识别提供大量的训练样本,还可以用合成的字符生成个性化文档。现有的关于字符生成的算法大部分都是关于英文字符,但这些算法都不适合汉字的生成。本文通过两个方面对汉字合成进行分析,一是用英文字符的方法即形状统计的方法进行汉字合成,具体包括了三个方面:汉字形状的变化表示、汉字笔划的形状表示和笔划、部首的空间结构统计。另一方面是基于汉字层次模型的合成方法,通过汉字的三层等级表示将汉字分解为基本的部件。这些基本部件形成笔划和部首数据集合。在合成过程,我们运用基于小波变换的特征提取方法选取合适的笔划和部首作为候选。并且我们从汉字的结构特征出发提出了一些汉字的“美学约束”。在组合过程中我们运用遗传算法来搜索符合“美学约束”的最优结果。具体内容包括四个方面:汉字的三层等级表示模型、汉字的“美学约束”定义、基于小波分解的特征提取、基于遗传算法的最优搜索。具体为:(1)汉字的三层等级表示模型大部分得汉字是由一些基本的笔划和部首组成,本文将汉字分解成“汉字→部首→笔画”三层模型。(2)汉字的部件之间的关系从汉字的结构性质出发,我们定义了一些符合汉字特性的“美学约束”,并将这些“约束”量法。并在搜索过程中搜索符合这些“约束”的汉字。(3)基于小波分解的特征提取本文引入小波变换,并利用小波变换的多尺度特性抽取汉字更为有用的“轮廓”信息。以此来选择候选的基本笔划和基本部首。(4)基于遗传算法的最优组合由候选笔划和部首组合得到的字符数量庞大,为了得到其中最符合“美学约束”的汉字,一个蛮干的方法就是穷举所有的汉字,但是效率太低。我们利用遗传算法来进行近似的最优搜索。
其他文献
作为一种法律救济制度,行政救济正在全世界范围内迅速发展。在我国,由于受到行政法学起步较晚的影响,我国行政救济的理论研究方兴未艾。行政救济法作为行政法的必要组成部分,
聚众犯罪是我国常见的犯罪形式之一,但同时也是我国刑法理论研究和司法实践中经常遇到的难点问题。聚众犯罪作为内容丰富的一大类罪,由于我国刑法相关立法规定存在诸多不足之
自20世纪80年代,国际技术领域出现了一种技术合作的趋势,企业通过资源共享和优势互补加强了彼此的合作创新。近年来,随着国际及国内的竞争日益激烈,企业研发成本迅速增长及对
20世纪90年代以来,我国的证券市场发展越来越迅速,在市场容量、交易手段、监管规则以及上市公司数量等方面都有了长足的进步。在这期间,作为企业资本增长和社会资源有效配置
行业协会作为沟通政府与企业的中介治理机制理应发挥更大的作用,但是其在实践中并未实现这样的效果。根源之一在于行业协会的行政主体地位不够完整。行业协会具有独立的公共
本文阐述了在海南人工环境条件下,竹叶兰试管播种苗的移栽育苗技术,包括试管苗的移栽育苗质量要求、育苗所需的基本设施备件、育苗的环境条件、移栽育苗的步骤、管理措施等内容
目的 观察早期综合干预和康复治疗应用于新生儿缺氧缺血性脑病的临床疗效。方法 选择我院收治的缺氧缺血性脑病的新生儿88例,随机分为对照组和治疗组各44例。对照组实施常规
<正>目的:探讨超声引导下经皮颈部结节性疾病的热消融围手术期的安全性,防止并发症的发生。超声引导下微波消融技术是一种肿瘤微创介入疗法,具有创伤小、见效快、治疗时间短
会议
本文主要谈艺术创作中关于“重复”的问题,通过对以往艺术家的作品进行分析,发现艺术家在艺术创作中大量运用重复这种手段,使作品达到累积效果而产生强大力量,而这种力量所带
目的探讨脑缺血后损伤肺组织肿瘤坏死因子-α(TNF-α)的表达变化。方法成年SD大鼠随机分为假手术组、脑缺血肺损伤组(n=13),其中每组5只用于免疫组化检测TNF-α在肺的定位分