手写体汉字识别实验平台及笔划网格特征提取方法的研究

被引量 : 4次 | 上传用户:enjoyyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机手写体汉字识别研究是一个涉及多种学科的课题。手写体汉字的数量巨大、类别繁多、结构复杂、以及书写风格差异性等特点,使其在模式识别广阔的研究领域中,成为一个极其富有挑战性的课题。建立一个统一的脱机手写体汉字识别实验平台是对手写体汉字识别研究方法进行客观分析、评价的重要方式和手段。本文设计和构建了一个脱机手写体汉字识别实验平台。并在实验平台基础上对汉字识别相关算法进行了深入的研究。研究的主要内容如下:1.手写体汉字识别的实验平台。首先对手写体汉字样本库进行了研究,介绍了样张的设计和采集,样本库构建流程以及样本信息的组织方式,构建了一个标准的手写体汉字样本字库。接着介绍了汉字常用的预处理技术。最后重点介绍了本文手写体汉字识别实验平台的系统架构,实验平台功能模块的设计。2.手写体汉字的特征提取。汉字的特征提取方法主要可以分为两类:基于统计特征、基于结构特征的提取方法。本文主要研究并在实验平台上编程实现了汉字识别中几种常用的特征提取算法。在此基础上,将笔划密度函数的定义扩展到对角方向上,构成对角方向网格,提出了一种新的基于笔划密度函数的双弹性网格方法,此方法不仅考虑到汉字的笔划结构中“撇”、“捺”笔划的书写特性,而且通过构造对角弹性网格技术弥补了纵横网格技术的不足之处。3.手写体汉字的分类识别。首先介绍了汉字分类中的一些典型的分类方法,如最近邻(KNN)分类法、贝叶斯(Bayes)判别分类法、支持向量机(SVM)和BP神经网络分类方法。同时介绍了AdaBoost算法的相关知识。接着,深入研究了用于手写体汉字分类的基于BP神经网络的AdaBoost方法。最后,在汉字实验平台的基础之上,对比了不同分类器的实验结果,验证了该方法的有效性。4.汉字识别实验平台的系统实现和识别实验结果及分析。首先介绍了汉字实验平台的系统实现。接着,对手写体汉字实验平台的性能进行测试,对比了构造样本集所用的时间,验证了本文构造的脱机手写体汉字识别实验平台的实用性和高效性。然后基于实验平台,对多种特征提取方法和分类识别方法,进行汉字识别实验并分析实验结果。验证了本文提出的基于笔划密度函数的双弹性网格算法的合理性和有效性。
其他文献
随着我国电子商务的快速发展,电子商务逐渐成为市场发展的主流,给企业带来了难得的发展机遇。其在企业中的应用有效降低了生产成本,提高了工作效率,扩大了市场规模,改变了企
随着我国人口老龄化的快速发展,老年人的养老问题已成为我国养老保障事业中存在的一个不容忽视的问题。本文通过对武汉市社区老年人养老服务的需求进行调查,从而有针对地改善
金融创新是金融发展的基本推动力,而金融创新动因是推动金融创新的动力之源,金融创新理论的核心也是动因理论。近年来,随着中国金融业的逐步开放和人民币的国际化,我国商业银
黄庭坚不幸落入“北宋党争”的漩涡中,升降沉浮,蒙受冤屈。后期的黄庭坚,逍遥而不消沉,更多转向诗歌与书法的发展,使之成为一名杰出诗人和书法家。
从融资的来源看,企业融资分内部融资和外部融资两种。以A公司为例,内部融资的数额有限,当企业面临突发状况或偶然契机时,很难在短时间内调剂大额资金以自足。外部融资分为股
近年来,随着平板显示和清洁能源的发展,有机电致发光器件(organic light-emitting devices, OLEDs)由于其超薄、功耗低等优良的特性在科研界和产业界都引起了广泛的关注。特别
运动损伤在篮球运动中较为常见,减少运动损伤应从预防入手。动作受限和身体不对称性对运动员来说则会降低运动效率,增加受伤的几率,功能动作筛查能够检测人体存在的动作受限
随着人们环保节约意识的增强,高效、节能、廉价、环保的油田化学品已成为国内外竞相研究的热点。植物酚类化合物是一类广泛存在于植物体内的重要的天然产物。开发和利用此种
城市住宅小区热辐射环境对城市局地微气候有着重要的影响作用。改善住宅小区的热辐射环境,不仅可以有效改善城市局地微气候环境,缓解城市热岛效应,还可以提高居住环境的舒适
学前教育是基础教育的重中之重,是国民素质全面提升的基础,引导个体健康、多元、全面的发展,使得义务教育阶段的教育效益和质量得以提升和巩固,改革开放以来我国学前教育事业