手写字符识别中关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:szf_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写字符识别是模式识别理论的一个重要应用领域,也是实现在各种背景下字符录入自动化的重要手段.特征提取和分类器设计是手写字符识别中的两个关键技术.虽然手写字符识别研究已经取得了很大进展,但在这两个方面仍存在尚待深入研究的课题.本文就围绕这两个关键技术,提出了新的方法.在特征提取方面,提出了基于梯度归一化的梯度特征提取.首先得到原图像的梯度信息,然后基于归一化函数得到归一化的梯度信息,最后基于归一化的梯度信息提取梯度特征.在预分类方面,提出了基于广义可信度阈值判别的预分类规则.给出了"基于后验概率阈值判别的预分类规则能够获得错误率和平均候选类别数的最优折衷"这定理的证明.依据广义可信度的定义,得到了"基于广义可信度阈值判别的预分类规则能够获得错误率和平均候选类别数的最优折衷"的推论.在提高分类器性能方面,提出了基于最小分类错误准则的街区距离判别函数.从增加原型数和优化判别函数两个方面,提高了街区距离判别函数的预分类性能.针对多原型问题,提出了基于快速κ-均值聚类算法的多原型学习;针对判别函数优化问题,分析了最大似然估计的不足,给出了基于最小分类错误准则的多原型街区距离判别函数优化算法.使用基于广义可信度-Ⅰ-阈值判别的预分类规则和P<,e>-N<->曲线比较了基于最小分类错误准则的街区距离判别函数和基于最大似然估计的街区距离判别函数的预分类性能,结果表明,前者的预分类性能优于后者的预分类性能.在识别方法方面,提出了主动判别函数.通过类别学习样本获得了类别主动原型模板的先验知识;类别主动原型模板根据先验知识"适度"的改变,使其与待识字符的距离最近,而相应的主动原型模板就是最优主动原型模板.将这最近距离作为待识字符与类别主子空间的距离;为了充分利用类别次子空间中的分类信息,还定义了待识字符与类别次子空间的距离.最终,将主动判别函数定义为待识字符与类别主子空间距离和次子空间距离的加权和.提出基于最小分类错误准则优化主动判别函数并给出了相应的优化算法.使用基于广义可信度阈值判别的预分类规则,并将优化后的主动判别函数与优化后的街区距离判别函数相结合,建立了完整的识别系统.
其他文献
学位
数据挖掘技术是解决数据丰富而知识贫乏的有效途径,当属信息科学领域的前沿研究课题之一,有关的研究和应用极大提高了决策支持的能力,已被公认为是数据库研究中一个极富应用
路由技术是无线AdHoc的一个重要研究领域。在人们为不同目的而设计的诸多路由协议中,AODV(AdHocOndemandDistanceVector)路由协议是IETF(InternetEngineeringTaskForce)的MANE
延迟容忍网络(Delay Tolerant Networks,DTN)是一种不同于传统TCP/IP类型网络的新型资源限制型特种网络。该类型网络与传统MANET网络不同:网络中的移动节点之间不存在稳定的
协同电子商务是企业在网络经济下发展的新方向。它是电子商务发展的高级阶段。其内部和外部复杂的交互和协作要求有一个强大的网络平台作为支撑。 P2P网络是一个拥有强大
多级互连网络是现代并行计算和交换系统的核心,如何构造具有良好通信能力、最优硬件代价和路由时间复杂度并可以无阻塞传输多播信号的多级互连网络是一个非常重要的研究课题。
随着分布式系统和网络技术的飞速发展,特别是上世纪90年代中期以来,数据源的数量不断增多,数据信息总量也以惊人的速率增长。然而,这些数据源分布在各种网络当中,存储在数据源中的
随着高性能计算机的普及,利用计算机协助人工来处理日常的信息已经成为当前计算机科学发展的重要方向。模式识别作为主要的智能信息处理技术已经越来越广泛地被应用到日常生活
当今嵌入式微处理器和DSP的设计中,功耗已经成为至关重要的设计因素,其中片上Cache访问是嵌入式芯片功耗的一个主要来源。基于这一点,本课题希望建立一种可重构Cache的结构,能够
指纹识别是指通过计算机,利用人体固有的指纹生理特征来进行个人身份鉴别的技术。由于人体指纹具有唯一性和不变性,使得指纹识别与传统的认证方法相比,具有更高的安全性和易用性