仿人识别手写体汉字的容错编码方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:hfwandy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类视觉感知是一个鲁棒性很强的、能抵御实际中各种变形和噪声干扰的具有良好容错性的文字识别系统。近年来,围绕手写体汉字图像识别的研究在很多方面已取得了重要进展。但如何提取与汉字结构类别密切相关的特征制定冗余容错的编码方法,提高机器仿人识别手写体汉字图像的灵活和容错性是值得研究的方法之一。 论文的主要工作如下: 1) 图像汉字的字型分类及提取。提出了一种图像汉字字型两级划分法。采用基于水平和垂直投影直方图与连通域相结合的方法,提取图像汉字的字型结构分类特征,并给出了字型分类编码。该算法能有效的对手写体汉字字型进行分类。 2) 图像汉字的容错编码方法。提出了一种用于机器识字的汉字容错编码方法。定义了仿人拆字的笔划字元集,给出易混淆笔划字元的多归类容错编码;归结了36类简单常用的子结构及笔划字元的顺序判断规则,并给出冗余的容错编码;建立了仿人构字的汉字编码规则和具有容错性的多模板字典。该方法能降低手写体汉字变形等因素的影响。 3) 基于容错编码的汉字识别。给出了基于容错编码的图像汉字识别方法。制定汉字统计特征码、字型特征码和笔划字元特征码的比对规则,给出了一种基于汉字图形轮廓特征的误差估计方法,并利用误差估计建立了一套带有反馈的汉字容错识别方法。 4) 可分类性和重码率分析。给出了标准样本汉字编码重码率和重码汉字的类型分析,并对重码汉字进行处理。 5) 容错性分析。对整个编码的容错性进行理论分析,给出手写体汉字的识别结果,并对拒识和误识汉字类型进行分析。 本文研究表明:基于容错编码的汉字识别算法能够有效地表征和区分出手写体汉字集,对笔划和字体的变形都有很好的容错性,能够有效提高识别系统的抗干扰性和识别率。
其他文献
能源供需系统是一个复杂的非线性系统。能源包括煤炭、石油、天然气、水电、核电等资源,按能否实现可持续利用分为可再生和不可再生两类能源。随着经济的发展,能源的供需问题研
人体运动的视觉分析是一个新兴的研究领域,涉及模式识别,图像处理,计算机视觉,人工智能等多门学科。其目的是要从视频图像序列中检测、跟踪、识别人体并对其行为进行理解与描
浮子流量计是一种传统的变截面流量计,具有结构简单、工作可靠、压力损失小且稳定、可测低流速介质等诸多优点,广泛应用于测量高温、高压及腐蚀性流体介质。但是目前在浮子流
科技发展到今天,语音处理已经与人们的日常生活密不可分。随着语音信号数字化,网络化浪潮的到来,VoIP系统逐渐风靡。VoIP(Voice over IP)是一门快速崛起的语音通信技术。它使
说话人识别是根据人特有的语音信号来识别出说话人身份的一种生物认证技术,在说话人识别技术中,关键在于两方面:其一,如何从数据量相当大的原始语音信号中提取出反映说话人个
配电网状态估计是配电管理系统(DMS)的一项重要的高级应用功能,是通过一些可以获得的量测数据估计另一些未量测的信息,从而将配电系统的信息补充完整,为分析和决策服务的过程。 首先实现了一种适用于配电网状态估计的基于节点电压法的潮流计算方法,既可以进行辐射状配电网潮流计算,又可以进行环状和网格状配电网潮流计算。 将配电网分解成若干区域,在各个区域端点的量测数据和区域内反映各个用户负荷的统计
随着科学技术的高速发展,对设备和被控系统的安全性、可靠性和有效性的要求也越来越高,有关复杂系统故障诊断技术的研究愈来愈受到重视,已成为国际自动控制界的热点研究方向之一
大型火电单元机组是一个高度复杂的大时滞、慢时变、并具有不确定性的被控对象,特别是锅炉侧存在着很大的迟延和大惯性,常规的PID控制器在处理大迟延对象上很难获得令人满意的控制效果。预测控制对处理大迟延对象具有独特的优势,本文将广义预测控制应用于协调控制系统锅炉主调节器中,在广义预测控制原理的基础上,提出了两种改进的广义预测控制算法:一种是具有预测误差及误差变化率校正的增量型广义预测控制算法;另一种是基
厚度精度是板带产品的重要质量指标之一,随着轧制理论和控制理论的发展,以及它们在轧制过程中的应用,板带产品的厚度精度有了很大的提高,但是实际系统应用过程中还有许多具体
本文以中频汽油发电机为背景,研制了一种新型的单极性调制的恒频恒压逆变电源。这种电源与中频发电机配合工作,为需要备用电源和流动作业的场合提供了方便的电能。论文首先对现