基于非线性状态估计(NSET)的手写体数字识别系统设计

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:yingzizhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]手写体数字识别技术在财会、气象、邮政等领域有着广泛的应用,探究数字识别新方法并付诸实践,可以产生巨大的社会和经济效益。本文从传统的非线性状态估计(Nonlinear State Estimate Technology,NSET)技术出发,将这种一般应用于设备运行状态监测领域的方法应用于手写体数字识别,并在美国邮政服务(United States Postal Service,USPS)手写数字识别库上进行测试。测试结果表明,该方法简单易行,运算效率高,对于解决非线性和高维模式识别问题凸显出其适应性强的特点。
  [关键词]数字识别 非线性状态估计 USPS 非线性运算子
  中图分类号:TP391 文献标识码:TP 文章编号:1009―914X(2013)34―0073―03
  0 引言
  本文将传统的应用于系统或设备状态监测领域的非线性状态估计技术(NSET)用于手写体数字识别,能够有效减小计算量,提高运算效率,并且在美国邮政服务(USPS)手写数字识别库上做了测试工作,最后给出测试结果及分析,表明NSET方法能够拓展应用于手写体数字识别系统,具有较高的正确识别率。
  1 非线性状态估计技术
  1.1非线性状态估计理论
  非线性状态估计(NSET)是由Singer等提出的一种非参数、非线性建模方法,通常应用于电子产品寿命预测[1]、设备状态监测[2]、核电站传感器校验[3]、风机齿轮箱温度预测[4]等领域,而用于模式识别领域,目前阶段还鲜有报道。
  USPStrainingdata.mat为训练用数据,采用结构体形式组织数据,其中成员变量traindata为特征向量,维数为256,成员变量traintarg為其所对应的数字,一共10列,10列中值为1的那一列代表数字,比如第一行中,第七个值为1,则代表这个数为7,特别指出的是,第十列表示0。USPStestingdata.mat为测试用数据,数据组织形式与USPStrainingdata.mat相同,无须赘述。图1为部分USPS样本。从图中可以看出,该字库中的字符笔画的形态、粗细和灰度等级的差别都很显著。
  2 功能实现过程
  手写体数字识别的一般流程主要经过了手写数字预处理(增强、二值化、细化、归一化)、特征提取(选择)和分类三个步骤。本文采用NSET方法,训练和测试工作主要在USPS手写体数字识别库上实现,而这个数据库已经完成了原始图像的预处理工作,即已经将灰度值归一化,并且按照一定规则组织数据,这样就可以集中精力进行识别算法的研究。原始数据的特征维数为256,这样一个高维数或更高维数的特征向量,如若采用传统的人工神经网络,易陷入维数灾难,而NSET方法只是简单的矩阵运算,可以有效减少运算量,提高运行速度。采用NSET方法的实现原理图如图2所示。
  程序功能实现上,可以分为数据录入模块、构建过程记忆矩阵模块、测试模块、测试结果输出模块等。
  在系统实际应用过程中,由于所针对的均为高维特征向量,难免影响运行效率和速度,所以将手写体数字识别系统人为划分为离线(Offline)和在线(Online)两部分。
  如图3中所示,离线部分主要是完成前期准备工作,这些工作不会影响实际运行的效率,在完成特征选取、前期预处理、构建过程记忆矩阵以及中间变量前期处理后,可以将其作为不变量存储,应用时直接从指定位置取出即可;而在线运行部分对识别系统的运行效率有着重要影响,这部分的实现算法需要精心设计,确保运行过程中不会出现“卡壳”现象或者导致系统本身运行速度变慢。
  3 仿真测试结果及分析
  前面已经述及,非线性运算符 是NSET实现的一个关键技术,它不仅解决了 可逆计算的问题,而且从不同的侧面刻画了观测特征向量和预测特征向量之间的相近或相似程度,对于探究特征向量之间的内在联系,把握重点信息具有重要意义。本文采用欧氏距离(DIST)和曼哈顿距离(CITY)进行了应用研究。
  源数据采用美国邮政服务手写数字识别库,若采用欧氏距离,测试总成功率为94.82%,单类手写体数字识别率统计如表1中第二列所示;若换做曼哈顿距离测试,其测试的总成功率为95.24%,单类手写体数字识别率统计如表1中第三列所示。并且针对每类字符,都进行了相应的平均识别率统计,结果附在表1第四列。
  从表1中可以看出,不同类别字符间识别精度存在差异,最典型的为字符4,采用欧氏距离其识别精度只有89.76%,明显低于其它类别字符识别精度,这与其笔画复杂程度有直接关系,使二值灰度信息不足以精确描述该字符,致使识别精度下降,但总体的测试成功率还是可以接受的。
  通过对两种不同的距离函数进行测试,比较其结果可以得出以下结论:采用两种不同的非线性运算子,总体测试结果改变不是很明显,但是所反映出来的单类字符测试成功率最低的三个字符分别为4、7、9,如前所述,单从形象意义出发,这三个字符笔画较为复杂,难以实现准确的特征描述。
  我们采用的NSET方法(欧氏距离和曼哈顿距离)实现手写体数字识别所能达到的测试成功率分别为94.82%和95.24%,而据报道,当前阶段研究工作者采用其他方法在USPS数据库上[6]实现所能达到的测试识别成功率以及相应的运算时间统计如表2所示。
  上述报道的这些识别方法识别率略高于本文中采用的NSET方法,基本上处在相同的水平,但是通过比较运算时间可以看出,上述三种方法的运算时间均在5000s以上,而NSET方法只有249s(或254s),相差一个数量级,切距核、虚拟SVM和人工识别这三种方法的较高识别率是以牺牲运算时间为代价的,在实际应用中会遇到实现效率的问题。并且如上节分析,基于NSET方法的手写体数字识别系统分为两个过程,249s(或254s)时间包括实现过程中的离线过程和在线过程,在付诸实际时,合理调整功能模块,运算时间完全可以进一步被压缩,实现高效率、高速运算。   4 结束语
  NSET方法的传统应用领域主要集中在系统或设备运行状态监测,本文从NSET的基本理论出发,提出一种借助于非线性状态估计的手写体数字识别新技术,扩展了其应用范围。该方法实施难度不大,直接采用了字符点阵作为NSET的特征输入,并没有进行专门的特征提取,识别算法取得了比较令人满意的效果,且运行效率较高,在解决非线性和高维模式识别问题中表现出了其适应性强的优势,且可调整参数少,适于在嵌入式系统上实现,对于探究机器识别新方法,并进行工程实践具有重要的理论指导和实际借鉴意义。
  参考文献
  [1] Cassidy K J,Gross K C,Malekpour A.Advanced pattern recognition for detection of complex software aging phenol- mena in online transaction processing servers[C].Procee- dings of Dependable Systems and Networks,Washington, D.C.,USA,2002.
  [2] Cheng S F,Pecht M G.Multivariate state estimation technique for remaining useful life prediction of electronic products[C].Proceedings of AAAI Fall Symp.Artif.Intell.Prognostics,Arlington,VA,2007: 26-32.
  [3] Bockhorst F K,Gross K C,Herzog J P,et al.MSET modeling of crystal river-3 venturi flow meters[C].Proceedings of International Conference on Nuclear Engineering,San Diego, CA,1998.
  [4] 郭鵬,David Infield,杨锡运.风电机组齿轮箱温度趋势状态 监测及分析方法[J].中国电机工程学报.2011,31(32):129 -136.
  [5] Christopher L.Black,Robert E.Uhrig,J.Wesley Hines.System Modeling and Instrument Calibration Verification with a Nonlinear State Estimation Technique[C].Proceedings of the Maintenance and Reliability Conference,Knoxville,TN,May 1998.
  [6] 夏国恩,金炜东,张葛祥.融合不变性特征的简易支持向量机[J].计算机工程.2006,32(18):184-191.
  基金资助项目:中央高校基本科研业务费专项资金资助(编号:12MS118)。
其他文献
[摘 要]在社会政治、经济形势发生深刻变化之时,在企业自身机制发生重大转变之际,企业思想政治工作和机制如不及时改进和完善,就不能适应当前任务与形势发展的要求,就会失去生命力。因此,必须建立健全一套与社会主义市场经济体制相适应的,目标明确、职责分明、关系协调、渠道畅通、稳定、高效、持久的管理体制和工作运行机制。  [关键词]思想政治 机制转换  中图分类号:Q555 文獻标识码:Q 文章编号:100
期刊
[摘 要]在电气工程中,项目管理发挥着举足轻重的作用。电气工程项目的管理对改善电力系统的质量与经济效益很有益处。本文笔者从成本管理、招投标管理、项目质量管理、项目安全管理这几方面讨论了电气工程项目管理。  [关键词]电气工程 项目管理  中图分类号:TP321+.24 文献标识码:TP 文章编号:1009―914X(2013)34―0093―01  随着工业与民用建筑的迅速发展,电气工程的地位和作
期刊
[摘 要]风力发电作为最成熟的新能源应用技术,现阶段得到了快速发展,但是由于项目实施过程中在设备选型、工程实施、发电运行、上网销售等环节存在较多普遍性问题,使得风力发电项目建设虽然启动较快,但普遍出现收尾拖延、预算超支、达不到财务预收益等许多现实问题,其中如何提高风电建设项目成本控制研究成为投资者关心的重要问题之一,本文就从影响风电项目成本控制的因素和风力发电项目成本控制途径两方面进行论述。  [
期刊
[摘 要]随着体制改革不断深化,路桥企业的基层党建和思想政治工作都面临着更加复杂的情况。建设一支素质优良、精干高效的政工干部队伍,是适应新形势、新任务要求的当务之急。因此,我们应该积极采取适当的措施来尽可能的完善企业政工队伍。本文就从对企业政工队伍建设存在问题及原因入手,进而提出了企业政工队伍建设的对策。  [关键词]路桥企业 思想政治工作 政工队伍建设  中图分类号:U24 文献标识码:U 文章
期刊
[摘 要]当前,电力体制改革的步子在逐步加大,整个电力企业的运营环境也发生了很大变化,特别是随着集约化、信息化管理的不断深入,如今电力企业迫切需要进一步加强管理创新,全面提高其运营管理水平,逐步增强企业凝聚力和核心竞争力。本文就电力企业的创新管理作出了分析。  [关键词]电力企业 创新管理 运营环境  中图分类号:U492 文献标识码:U 文章编号:1009―914X(2013)34―0110―0
期刊
[摘 要]在公路施工中,施工技术的管理是其中核心关键点。只有对施工技术进行科学、合理、正确的管理,施工企业才能够提高公路工程的施工质量,从而提高施工企业的经济效益,促进企业迅猛、积极、健康的发展。本文阐述了公路施工技术管理的重要意义及问题解决方法,仅供同仁参考。  [关键词]公路施工 技术管理 常见问题 解决办法  中图分类号:TU71 文献标识码:TU 文章编号:1009―914X(2013)3
期刊
[摘 要]政工人员是一个部门和单位思想政治工作的组织者和实践者。其能力强弱和素质高低直接影响工作的实效。因此,政工人员必须在发展大局上思考。着眼形势和任务需要,以负责的精神,抓好素质和能力的综合养成,加强高素质的政工队伍建设。  [关键词]企业管理 政工人员 队伍建设  中图分类号:D631.1 文献标识码:D 文章编号:1009―914X(2013)34―0112―01  前 言  中国的改革开
期刊
[摘 要]煤矿安全关系到煤矿企业能否安全高效的生产和发展,它成为了一个永恒的煤矿主题。加强安全管理,创新安全管理模式是每一个煤矿安全管理工作者的责任,我矿在创新安全管理体系,创新企业的安全管理方面进行了探索,以此来不断的提高全体员工的整体安全意识,真正实现企业的安全高效的生产和发展。  [关键词]安全管理体系创新 企业文化安全建设 煤矿生产  中图分类号:TE4 文献标识码:TE 文章编号:100
期刊
[摘 要]文章采用访谈法、专家小组法得出HRP胜任力的初始构成要素,随后采用问卷调查法和数理统计法得出构成HRP胜任力模型的4个核心胜任力因子和14个胜任特征因素,为中国企业HRP人员的甄选和HRP人员专业素质的提高提供借鉴和参考。  [关键词]胜任力 胜任力模型 HRP  中图分类号:F241 文献标识码:F 文章编号:1009―914X(2013)34―0114―01  1.相关理论综述  1
期刊
[摘 要]强化用电检查是进一步加强发电厂用电安全管理,确保发电厂设备以及人身的安全的重要举措,同时也是保障电力生产以及电网运行安全的重要手段,对促进我国电力事业的发展具有积极的意义。因此,电力企业要引起对用电检查工作的高度重视,将其作为工作的重点,仔细分析当前用电检查工作中存在的问题,并采取有力的措施加以解决,为我国电力事业的稳定快速发展提供保障。  [关键词]电力企业 用电检查 问题 措施  中
期刊