基于粗糙集和遗传算法的脱机手写体汉字识别方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:bluebabyyejing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机手写体汉字存在数量大、结构复杂以及变形多等问题,对其自动识别被公认为字符识别领域中难题之一。粗糙集理论是一种处理不精确、不确定性问题的数学分析工具,遗传算法是一种自适应启发式搜索算法,本文将遗传算法和粗糙集理论结合起来解决脱机手写体汉字识别中结构复杂、变形多的超多类模式识别问题。本文主要研究工作如下:1.基于粗糙集理论中广义论域信息系统理论,采用汉字真实值作为先验信息,构建了一种脱机手写体汉字识别决策信息系统。2.采用“熵”值来表征决策信息系统中脱机手写体汉字特征的重要性,给出了一种基于遗传算法的脱机手写体汉字特征向量约简算法,在不损失原有信息的条件下,减小特征向量维数,降低了识别过程的复杂度。3.基于粗糙集理论的规则冲突判断,给出了一种启发式冗余样本约简方法,约简多余的训练样本,进一步降低识别过程的复杂度。4.提出了一种基于规则置信度的脱机手写体汉字规则融合识别方法。当找不到与待识别汉字样本完全匹配的规则而无法识别时,通过规则融合识别方法,得到未知汉字样本的识别结果。从而降低系统的拒识率。选取了SCUT-IRAC手写体汉字样本作为实验样本,在MATLAB 7.0环境下,进行了实验验证。结果表明,本文提出的特征约简方法对脱机手写体汉字多维统计特征的约简效果明显;启发式冗余样本约简方法能对训练汉字的冗余样本进行有效的约简;规则置信度融合识别方法能提高脱机手写体汉字识别系统的可识别率。
其他文献
具有限定记忆的辅助变量参数辨识方法与仿真研究最小二乘辨识法是一种最基本的辨识方法,简单、实用,其递推算法收敛可靠,并且当模型噪声为白噪声时,可得到无偏、一致和有效的
中国加入WTO以来,服装企业面临的市场竞争非常激烈。生产成本的提高、管理模式的落后,使我国服装产业的优势不断削弱,行业发展面临巨大压力。加快企业的信息化建设,已经成为了行
根据2004年4个航次的调查资料,研究了长江口及其邻近水域溶解无机氮的分布变化特征。结果表明,高浓度溶解无机氮集中分布在河口附近。一般来讲,近岸硝酸盐浓度上层高于下层,
网络化控制系统(NCS)是将通讯网络引入到传统控制系统实现系统元件间信息交互的一类先进控制系统,具有低成本、易维护、信息共享和远程控制等优点,已经被广泛应用于诸多现代工
数字水印技术作为数字产品版权保护的一种有效手段,近年来成为国内外一个研究的热点。鲁棒水印算法必须具有两个重要的属性:不可见性和鲁棒性。然而这两种属性之间存在必然的
清科研究中心近日发布的数据显示,2016上半年中国创业投资市场基金募资活跃度虽然有所下降,但大型机构的募资金额仍然十分庞大;私募股权投资市场热情高涨,未来更加通畅的股权
随着人们对社会安全要求的增加,基于生物特征识别的智能身份鉴别方法逐渐受到广泛的关注。由于虹膜识别具有高可靠性和非侵犯性,它正成为生物特征识别领域中的一个研究热点。
近几年来,随着数字电视在我国的大力普及,用户对数字电视的要求越来越高。从目前用户的需求来看,数字电视主要有两个发展方向,一是能为用户提供高质量、高清晰度画面的数字高
随着各种非线性电力电子设备的大量应用,谐波对电网的污染日益严重,影响了电能质量和供电可靠性。论文介绍了电力系统谐波产生的原因及其危害,指出谐波测量的重要意义及谐波测量
随着嵌入式技术、计算机网络技术和通信技术等电子技术的发展,促进了各种智能仪表的应用,为电能管理系统的发展提供了条件。本课题采用电表+采集终端+集中器+主站上位机的四层