基于AP算法的手写字符聚类分析研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:hoko0428001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符识别一直都是模式识别领域中的一个热门研究课题,在数字化办公、文字信息化存储等方面都有着重要的应用价值和社会意义。虽然目前大多数字符识别技术已运用到我们的日常生活中,但脱机手写字符识别的研究依然还处于实验研究阶段。手写字符相似性高、书写无约束、同一字符具有多种书写风格的问题严重影响了脱机手写字符识别质量。本文以手写汉字为研究对象,构建了脱机手写汉字识别系统,从汉字字符图像规范化,到统计特征提取,再将高维冗余统计特征压缩得到低维、精确特征,最后经过分类器训练得到每个字符最具代表性的字符模板,以供测试字符识别。针对使用单一字符模板的脱机手写汉字识别系统字符识别正确率低的问题,本文利用聚类分析能够对同一事物不同形态做出合理分类的特点对脱机手写汉字识别系统进行改进,分别对所有汉字不同训练样本的低维统计特征进行聚类,得到同一汉字的多个不同书写风格模板。实验结果表明聚类算法能提高脱机手写汉字识别系统的识别正确率,在众多聚类算法中AP聚类能得到较好识别结果。针对AP聚类算法需要预先设置偏向参数以得到不同类别个数的缺陷,本文利用聚类评估函数能够评判聚类质量的特点对AP聚类算法进行改进,该算法能在算法迭代过程中自适应地改变偏向参数以调整类别数,并且结合每次的聚类质量得到最优的聚类结果。实验结果表明,本文提出的改进算法改善了算法收敛性和聚类质量,进一步提高了脱机手写汉字识别正确率。
其他文献
随着XML(eXtended Markup Language扩展标记语言)技术的快速发展,越来越多的数据使用XML进行表示,XML已经逐渐成为Web上数据表示和交换的标准。在电子商务等的应用中,参与交
目前,搜索引擎存在着冗余信息过载和索引数据库信息覆盖率低的问题,发展个性化的元搜索引擎是解决这两个问题的一个重要途径,由于元搜索引擎可以同时调用多个独立搜索引擎,提
虚拟手交互是把人手操作的信息输入到虚拟环境中,主从控制相应的虚拟手对虚拟物体进行操作。为了改进虚拟手交互的自然性和真实性,本文基于虚拟手交互提出了一种虚拟手抓持力
学位
随着Internet的迅猛发展,网络正在影响社会的政治、经济、文化、军事和生活。由于人们对网络的依赖程度不断提高,安全问题变得越来越严峻。入侵检测作为一种积极主动的信息安
1998年,Tim Berners-Lee提出了“语义Web”的概念,语义Web研究的主要目的就是扩展当前的WWW,使得网络中信息都是具有语义的,便于人和计算机之间的交互合作。语义Web的兴起促
软件测试是软件开发的关键过程之一,对于确保软件产品的质量也有着十分重要的作用。软件测试的自动化技术帮助软件的开发人员和测试人员在更短时间内开发出更高质量的产品,通
在现有的并发分布式系统中,信息的发送往往是非阻塞的,必须采用异步的通信方式。而实际的程序设计严格区分输入和输出动作,即非对称通信。本文研究一个新进程演算,即异步非对称Ch
消息中间件为分布式应用提供灵活高效和可靠的异步消息传递机制。Java消息服务(Java Message Service,JMS)是Sun公司提出的,为解决异构消息中间件之间互操作难问题提供可选方
人脸表情识别是一个新兴的研究课题,在众多领域有广阔的应用前景。人脸表情识别系统分为三个阶段:图像预处理、表情特征提取和表情分类识别。本文以人脸表情为研究对象,以表