基于极限学习机的脱机手写体汉字识别研究

来源 :东北大学 | 被引量 : 4次 | 上传用户:wef123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为汉字自动输入技术之一的汉字识别技术是汉字信息处理的重要接口技术。它能在信函分拣、银行支票识别、统计报表处理以及手写文稿的自动输入等诸多方面发挥巨大的作用。然而,由于手写体汉字的书写随意性很大,在整个字符识别领域中,手写体汉字识别的难度较大,成为该领域最具有挑战性的课题。本文主要研究内容为:汉字图像预处理,汉字特征向量的提取,重点研究了极限学习机ELM (Extreme Learning Machine)的改进算法最优投票极限学习机OV-ELM (Optimal Voting ELM)在汉字识别中的应用。本文首先对汉字图像的预处理技术进行了分析,包括对样本图像的归一化、平滑去噪、字符切分、二值化、汉字细化处理等。在分析现有特征提取方法的基础上,针对小字符集汉字识别的特点,本文利用弹性网格方向像素概率分布的特征提取方法,提取用于极限学习机分类器输入的特征向量;在分类器设计中,本文设计了基于最优投票机制的极限学习机优化算法OV-ELM,利用OAO(One-against-one)或者OAA(One-against-all)的思想,将一个多分问题降解为多个二分问题来提高分类的准确率,并且OV-ELM优化了传统的投票机制,对投票值以概率的方式给出,从而避免了得票数相同情况的发生。从本文设计的一系列实验的结果可以看出,本文提出的基于弹性网格汉字特征提取方法在特征向量提取方面效果良好,采用OV-ELM算法虽然相比ELM算法牺牲了一定的训练时间,但仍旧远远优于传统BP神经网络,并且在分类的准确率等方面的性能超过了ELM、支持向量机。整体分类框架在脱机手写体汉字识别方面取得了令人满意的分类性能。
其他文献
本文采用体内与体外方法相结合考察(制)何首乌对大鼠肝脏的影响,考察药物对大鼠肝脏各生化指标的变化规律以及对肝胆系统转运蛋白的基因表达;采用大鼠肝脏细胞探讨药物体外成
笔者运用增液汤合甘桔汤加味治疗咽源性咳嗽20例,疗效满意,总结如下。 1 一般资料 共35例,均为我院门诊病人,随机分为治疗组和对照组。其中治疗组20例,男12例,女8例;年龄18~60
在工业生产中,仪表一直都是一个十分重要的装置,其发挥着对生产过程状况的监测与反馈作用。鉴于此,工业领域对仪表的自动化技术不断进行研究,并由此发展出诸多类型的自动化仪
“品质上乘,储产量大,交通便利”、“重晶石之乡”果然名不虚传。来自新加坡的刘经理在象州寺村、罗秀几处矿山考察时赞不绝口,并当场与象州矿业公司签定了订购意向合同,之后也陆
近几年来,笔者采用中药治疗功能性消化不良56例,取得满意疗效,报告如下.1临床资料共76例中,男36例,女40例,年龄18~70岁.随机分为治疗组56例,对照组20例.
在多种因素的综合影响下,章太炎由信奉历史进化论转而提出了人类社会历史善恶、苦乐、智愚双向俱演的俱分进化论。章太炎形成俱分进化论主要有三方面的原因:一是个性的潜在影响
黄腐酸是一类分子结构复杂的有机弱酸混合物,其来源不同,腐化过程不同,提取工艺不同等均有可能造成其化学和药理学活性上的差异,这极大的限制了其在药用上的研究进展,因此很
笔者从医30余年,用刘铁簪老中医自拟柴苍荆蝉汤治疗荨麻疹200例,疗效满意,现报道如下.
本文对美国和巴西两个国家生物燃料乙醇发展的经验进行了总结,同时对我国生物燃料乙醇产业的现状进行了分析,重点回顾了我国推动生物燃料乙醇产业发展所采取的主要措施,指出
桂林市“十五”计划期间的重点技改工程之一龙广滑石开发有限公司超微细滑石粉厂已竣工投产。它标志着桂林市作为国内最具现代化水平的滑石加工企业步入一个新的发展时期。产