聚类分析在手写汉字识别中的应用

被引量 : 0次 | 上传用户:Mondy_xu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科学技术,特别是计算机技术的迅猛发展以及网络的普及,人们有更多的机会和便捷的手段获取和接触到大量的信息。但是也增加了从中获取有用信息的难度。为了从大量数据集合中找到模式,人们引入了聚类分析技术。目前,聚类分析已广泛应用于数据挖掘、图像分割以及模式识别等领域。本文主要研究聚类分析在手写汉字识别中的应用。手写汉字识别是模式识别中的一个重要的研究领域,通常情况下,分类识别都应用单模板分类器,也就是每一类汉字用单一模板表征。但是在手写文字识别中,由于不同的人书写习惯和方式不同,手写汉字通常会出现不同的书写风格,导致同一类汉字的书写字符差别较大,如果用单模板表征,会对整个系统的性能有很大影响。因此,为每一类别的不同风格汉字建立多模板显得很有必要。本文应用聚类分析将不同风格的书写汉字进行分类,提升了整个系统的性能。本文首先对聚类的概念、思想进行了详细的分析。目前,已经出现了很多聚类算法,主要有以下五种:基于层次的聚类、基于划分的聚类、基于密度的聚类、基于网格的聚类以及基于模型的聚类。这些聚类算法各有优缺点。本文在第三章实现了基于聚类的多模板手写汉字识别框架,该框架结合8方向特征提取算法和LDA算法,并选取了K-means、模糊k-means和谱聚类三种聚类算法进行了实验,在该框架中均取得了良好的效果,识别率有很大的提高。同时对比了这三种聚类算法在手写汉字识别中的识别性能。针对现有聚类算法的复杂度较高,本文介绍了一种快速K-means聚类算法,这种算法基于有序链表技术,实验表明,在维度不高的情况下,效果明显,比普通的K-means算法快。同时将该算法应用于手写汉字识别中,识别性能比普通的K-means聚类算法好,稳定性也良好。
其他文献
伴随着人口老龄化的浪潮席卷全球,老龄化所带来的社会问题日益突出。一方面是家庭功能的弱化难以满足急剧增加的老年护理需求;另一方面,庞大的医疗费用和专业护理费用给老年
本文通过对军事职业教育和MOOC理念的理解和分析,提出以MOOC模式为切入点,从MOOC课程、MOOC平台、MOOC教学三个方面构建军事职业教育体系的对策建议。
随着信息化时代的到来,我们的生活变得更加便捷,汽车的数量也与日俱增,这就需要一个高效的方法来实现对汽车的管理。智能交通系统在这种背景下应运而生,而智能交通系统的关键
以内蒙古国华准格尔发电有限责任公司发生的2次旋转机械设备振动故障为例,通过对其振动频谱图中出现的二倍频分量进行分析,找到了设备发生振动的原因为旋转机械设备轴系存在
目的:探讨老年高脂血症患者不同剂量他汀类药物调脂治疗的疗效.方法:老年患者130例,均服用阿托伐他汀,并随机分为3个剂量组,大剂量组阿托伐他汀每日20mg,中等剂量组每日10 mg,
目的探讨益髓生血颗粒治疗血红蛋白H病(HbH病)的临床疗效。方法采用自身对照方法,35例HbH(25例非缺失型HbH病患者和10例缺失型HbH病患者)病患者服用益髓生血颗粒,疗程3个月。
随着社会进步、发展,检测行业逐渐壮大,持续稳定增长,第三方检测企业变得更加活跃,更加具有市场运作的潜力与上升空间,本文将结合检测公共服务社会化的现状,对存在的问题进行
<正>琵琶被冠以中国民族乐器"皇后"之美誉,这件乐器承载了太多的中国历史文化,是中国几千年来积累的音乐珍品中最具代表性的文化符号之一,在中国文学史和中国音乐史中均占有
芍药(Paeonia lactiflora Pall.)是我国的一种重要草本花卉,我国芍药种质资源十分丰富。在长达数千年的栽培历史中,受地域限制及多变气候的影响,在自然选择和人工选育的基础上,
作为一种新兴的区域经济模式,临空经济区的发展及其带来的经济效应已经引起各界的广泛关注。随着我国民航事业的发展和国民经济水平的提高,许多城市和枢纽中心开始大力投资建