脱机手写女书文字识别技术研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:SunwithKing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
女书是世界上最具性别意识的文字,有着重要的非物质文化遗产保护价值。到目前为止,女书文献主要依靠手工抄写的方式传承,而随着女书传人的相继去世,女书文献的收集和整理变得更加困难,女书文化濒临消失。针对此问题,本文将脱机手写文字识别技术应用到女书文献的信息化上,为保护和发扬女书这组中华民族珍贵的文明基因尽自己的一份力量。本文在对目前脱机手写文字识别算法进行详细分析的基础上,针对女书自身的特点提出了一种脱机手写女书文字识别方案。从方案的设计着手,详细分析了脱机手写女书文字识别的工作流程,各部分的功能和常用算法,将周边方向贡献度特征提取算法应用到女书文字的特征提取上,并提出了一种改进的笔画密度特征提取算法和一种三级距离分类识别算法;设计并实现了一个实用的女书识别系统。本文的主要工作和特色如下:1)针对女书文字的样本,采用平滑算法和二值化算法去除样本图像中的方格噪声和背景,并根据女书样本中文字分布的特性,采用行合并的切分算法切分女书文字。最后将切分出的女书文字归一化成统一规格。2)分析了两种笔画密度特征提取算法的特点以及它们应用在女书文字上的不足,将周边方向贡献度特征提取算法应用到女书文字的特征提取上,并根据女书文字倾斜的特性,提出了一种改进的笔画密度特征提取算法。3)对现有多级距离分类器进行了分析,针对欧式距离在识别过程中的不足,设计了一种三级距离分类器。分类器的一级分类采用Manhattan距离,二级分类和三级分类采用误差均衡距离,该分类器具有Manhattan距离分类速度快和误差均衡距离分类能够使女书文字特征中稳定的部分得到突出,不稳定的部分被抑制的优点。4)采用本文提出的改进笔画密度特征提取方法、三级距离分类器等算法,设计并实现了一个脱机手写女书文字识别系统。用系统进行了仿真实验,对实验结果进行分析和比较。
其他文献
为了帮助每个用户找到最适合他的信息,推荐系统根据每个用户独特的兴趣特点,预测和发现用户潜在的兴趣,把用户最需要的信息推荐给用户。协同过滤是最主要的一类推荐方法,然而协同
随着计算机网络技术与多媒体技术的快速发展,丰富多彩的数字信息给人们的学习和工作带来极大的方便,促进了社会的发展,但同时引起许多信息安全问题。信息隐藏技术是一种重要
虚拟植物是指在计算机上进行植物生长模拟并运用可视化技术进行展现的技术。它一般以植物个体或群体为研究对象,涉及到计算机科学、植物学、生态学及人工智能等学科并在数字
分子对接是指通过计算机模拟小分子配体和大分子受体之间的相互作用。在过去几十年里,世界上各个研究小组开发了数个分子对接软件,其中,Kuntz研究小组开发的DOCK分子对接软件
金保工程是社会保障体系的重要组成部分,随着我国经济体制改革的不断深化,金保工程建设成为建立健全和完善社会保障体系、加快劳动力市场“科学化、规范化、现代化”建设的重要
基于多Agent技术的电子商务模型是电子商务技术领域的重要研究课题。由于多Agent系统本身具有动态性、开放性、不确定性,服务请求Agent选择服务提供Agent时具有一定的风险,可基
新一代网络带宽越来越高,通信具有更小延迟和更大吞吐量,校园网和园区网的骨干网络网速已提高至Gbps甚至10Gbps级,分布于骨干网上的传统网络入侵检测系统(NIDS)与网络入侵防
随着我国经济的快速发展,城市化进程不断加快。伴随着各种交通工具方便人们的出行,交通事故频发也给人们的生命财产安全带来了巨大的损失。为了提高驾驶人的驾驶水平,解决现
随着网络传输和处理能力的大幅提高以及音频和视频压缩技术的发展,网络音频、视频应用成为基于网络的重要应用之一。组播技术通过不同于传统单播和广播的转发技术和QoS机制,
脑机接口(Brain-Computer Interface,BCI)是近年来发展的一门新兴的、多学科交叉的人机接口技术。它是一种不依赖于人正常外围神经和肌肉组织而构成的通讯系统。基于脑电图(E