手写体数字识别中的关键技术研究

来源 :北京邮电大学 | 被引量 : 12次 | 上传用户:myywy123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息化飞速发展的今天,光学字符识别技术一直扮演着重要的角色。手写字符识别作为光学字符识别领域中的一个重要分支,有着广泛的现实应用(如:邮件自动分拣、统计报表录入、银行票据识别等)。此外,该领域的研究成果也能够推广到诸如汉字识别、人脸识别等其他模式识别领域。因此,对于手写体字符识别的研究既具有现实应用意义,同时也具有理论学术意义。特征提取和分类器设计是光学字符识别中的两个关键技术环节。在特征提取方法中,主成分分析是一种被广泛采用的方法。但该方法存在运算时间长、识别率较低、工程实际应用困难等问题。在分类器设计环节,神经网络凭借其出色的分类性能而被广泛采用。在神经网络训练算法中,BP算法是一种被广泛采用的算法。但BP算法是基于梯度下降理论设计的,该算法存在着诸如容易陷入局部极小、隐层神经元个数选择缺乏理论依据、训练时间长等诸多问题。近年来,在人脸识别领域提出了二维主成分分析的特征提取方法,较之传统主成分分析方法具有更高的识别率和更短的特征提取时间。本文在此基础上,改进了主成分分析中的特征生成矩阵,使用了新的样本像素分类方法,提高了系统的识别率。在神经网络分类器训练环节,使用了代数算法来训练网络,取得了出色的训练和识别效果,改善了BP算法在识别率、训练速度、训练精度等方面所存在的问题。具体来说,本文主要做了以下几项工作:1.将近年来在人脸识别领域提出的二维主成分分析算法应用于手写数字识别问题,并与经典主成分分析算法进行了对比实验。实验结果显示,二维主成分分析算法在特征提取时间以及识别率上都要优于经典的主成分分析算法。2.在二维主成分分析算法的基础上,在计算特征生成矩阵阶段提出了新的样本图像像素分组策略NetPCA。该方法综合了统计特征和结构特征两种特征提取方法。在样本测试阶段,使用该策略提取的特征的最佳识别率要优于二维主成分分析。3.使用代数算法这一新的神经网络学习算法来训练神经网络分类器。该算法将复杂的非线性优化问题转化为了简单的代数方程组求解问题,并实现了代价函数为0的精确映射。解决了传统BP算法容易陷入局部极小、训练时间长、网络结构参数确定缺乏理论依据等缺陷。4.实现了基于主成分分析特征提取、神经网络分类器的手写数字识别系统。并通过了对美国国家邮政局USPS字库中全部字符完整的识别实验,证实了上述算法的有效性和准确性。
其他文献
<正>坚信"格局决定结局"的娄国强,在高起点上"布局",在关键环节"发力"着力提升医院品质。与其说是采访,不如说是听课。"我个人认为,当院长要有强烈的品质意识。品质是产品的
生物质与煤混烧可以利用生物质碳循环的优点,并适用于现有燃煤锅炉改造,有效地降低成本,提高燃烧效率,但是由于生物质相比于煤含有更高含量的碱金属,而这些碱金属矿物在燃烧过程中
儿童行为问题指儿童期出现的,在严重程度和持续时间上都超过了相应年龄所允许的正常范围的异常行为。儿童行为问题起源于生命早期且具有持续性,被认为是普遍的和稳定的现象,
<正>中国业已公布的农业收购计划包括牧场、农用化学品、加工设备和食品企业彭博社最新公布的数据显示,中国在过去5年中斥资327亿美元收购食品资产和农场,今年的投入可能会创
我国是废铝消费大国,但再生铝生产技术整体水平较低,再生铝合金锭质量得不到保证,其主要原因之一是缺乏先进的铝熔体在线精炼处理技术。美国Almex公司的LARS是目前最先进的铝
我国中药发展很快,应用日广,但在新药研究,特别是改剂型仿制药中,存在创新发展不够、低水平重复严重、疗效不突出、安仝性不重视、质量不高等问题。尤其是同一药物多种剂型、
本文从具有明显“突眼”症状的七带石斑鱼病灶组织中,分离出1株致病力较强的优势菌CB1008,经人工感染试验证实为七带石斑鱼“突眼”症的致病菌。采用肌肉注射的石斑鱼幼鱼半
外周免疫器官起源于中胚层,形成于胎儿晚期,主要包括脾脏、淋巴结和消化道、呼吸道和泌尿生殖道的淋巴小结等,是免疫活性细胞定居、增殖和对抗原刺激发生免疫应答的场所。外周免
胶州湾是青岛的资源宝库,其周围形成了环胶州湾产业集聚带,胶州湾可称为“财富之湾”和“希望之湾”,但胶州湾现正面临一系列的环境、生态、淤积等问题,另外,胶州湾地理的隔
社区是基层治理的基础和切入点。本研究通过回顾与总结我国城市基层治理模式在以社区为载体的基础上的实践经验和理论模型,结合国内外主要基层治理模式的现状与启示,对深圳基