多模型融合在手写数字识别中的应用研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:oliveloveyou6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为字符识别的一个重要研究分支,手写数字识别在大规模数据统计、财务、税务、金融以及邮件分拣等领域具有广泛的应用。手写数字识别的应用领域要求识别的结果不允许有任何误差。虽然只有10个数字,由于数字书写随意,有明显的区域特性,再加上不能借助上下文的关系,导致手写数字识别的研究更具有挑战性。为实现高效、快速的手写数字识别,本文首先基于逐像素特征建立了手写数字识别模型。通过实验验证分析,发现基于逐像素特征的识别模型对存在笔画粘连缺失、多余笔画信息、字符倾斜等三种缺陷的手写数字图像识别性能较差,不能很好地将相似字符对区分开来。为弥补逐像素特征识别模型的不足,在分析逐像素特征识别模型的误识样本图像的基础上,提出一种新的结构特征——凹线特征。由于凹线特征具有描述手写数字轮廓凹线的形态及位置的能力,因此对字符细微结构差异敏感。提高了“相似字符对”分类的准确度。实验结果表明,凹线特征虽然具有解决“三缺陷”图像“相似字符对”的分类能力,然而,由于凹线特征提取的仅为数字字符的局部信息,不能解决数字字符轮廓曲线出现噪声干扰的问题,对存在“笔画断裂”“笔画噪声”等问题的图像不能很好地识别。为弥补凹线特征的不足,在分析逐像素特征识别模型误识样本图像的基础上,又提出一种新的统计特征——旋转投影特征。旋转投影特征提取数字字符各个方向上的投影值,能够体现数字字符笔画密度分布情况,解决了凹线特征随字符轮廓噪声干扰而变化的问题。实验结果表明,旋转投影特征虽然具有解决带有轮廓噪声干扰的手写数字图像识别的能力,然而,数字字符细微结构的变化严重影响投影值,因此,旋转投影特征识别模型不能很好地识别有细微结构变化的手写数字。考虑到逐像素特征、凹线特征、旋转投影特征的互补特性,将分别基于三种特征的识别模型通过基于先验知识的加权投票融合算法进行融合,构成手写数字识别系统。实验结果表明,系统在一定程度上提高了相似字符对的识别率,从而实现了整体识别率的
其他文献
区间优化算法是一种基于区间分析且有别于传统优化方法的方法,它是将区间变量作为运算的基本单元,并形成了一套逐渐完善的运算规则。在控制领域,不管是在理论研究方面还是实
耐火材料是高温、化工等行业的重要应用材料。随着我国社会经济的发展,各行业对耐火材料的需求也显得相当重要。转运车作为耐火材料生产线上的重要组成部分,在自动化技术的发
本设计涉及BEPCII(正负电子对撞机二期改造工程)项目的一部分,分为上位机系统和下位机系统。上位机部分的操作员控制台使用SUN工作站,磁铁电源系统的控制计算机选用MVME243 1,它
在化工、轻化、冶金等生产过程中广泛存在着时滞现象.时滞常常是导致实际控制系统品质恶化甚至不稳定的主要因素.随着纯滞后的增加,控制的难度显著增大.因此,时滞系统控制一
随着我国综合国力和国际地位的不断提升,越来越多的世界级和国家级大型活动选择中国城市作为举办地。其成功举办不仅提高了城市的知名度,更促进了经济、文化等的快速发展。而能
山东绿源化工集团是以生产硫基三元复合肥为主的国有大中型企业,是全国最大的复合肥生产基地之一,其产品畅销全国各地并销往海外,其扩建的20万吨/年硫基三元复合肥工程是山东
成组作业生产优化调度在现代化生产中对提高生产效率,增加企业经济效益有重要意义,而它所涉及的组合优化问题大多数是NP-Hard问题.因此对该问题的研究具有广泛的应用背景和理
该文首先综述了容错控制各个领域的发展现状,深入研究了几种容错控制方法.首先讨论了一类范数有界不确定性的线性系统的容错控制问题,当一些传感器和执行器在指定的子集内故
文章介绍了扩频通信原理及直接序列扩频,并且介绍了基于该技术的远程集中抄表系统的设计原理和系统组成,给出了电力线扩频通信单元的设计,着重介绍了低压载波通信芯片中同步系统并分析了同步过程的两个阶段:搜捕阶段和跟踪阶段。
该文所讲座的张力控制系统实质上是一个以矢量变频调速为基础的速度跟踪系统通过控制各环节间承印物的线速度同步,间接实现恒张力控制张力控制器的作用主要是补偿线速度差.为