基于Hadoop平台的字符识别的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:liongliong424
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符识别是模式识别的一个重要分支,它是一门研究如何利用计算机系统自动识别各种媒介上印刷的或手写的字符的技术。随着社会信息化进程不断提高,我们在日常工作中经常需要将大量的字符信息转换成计算机可存储可处理的信息。字符自动识别技术的发展帮助我们自动完成这项工作。但是,随着数据量的不断增大,传统的单机字符识别系统的效率难以达到要求。针对这个问题,本文对字符识别进行了研究,以提高字符识别的效率。首先本文以车牌识别为例研究了字符识别系统的一般识别流程和实现方法,包括车牌图像预处理、分割、特征提取、字符识别等操作,探讨了使用模板匹配识别和神经网络来进行字符识别的方法;然后本文阐述了字符识别与分布式系统结合的意义,研究了在Hadoop平台下基于MapReduce编程框架的分布式系统的实现,提出了分布式字符识别的方法并给出了设计方案;最后,本文将分布式字符识别系统与单机字符识别系统进行了实验,对其执行任务的效率进行了分析对比。
其他文献
防火墙是最广泛部署的安全机制之一,其有效性取决于网络过滤策略的配置。如今,防火墙策略异常检测与处理技术已经普遍应用于现实场景中。在防火墙中存在异常策略时,系统会对
随着信息技术的快速发展,信息管理系统逐渐开始普及。大部分企业及高校开始构建自己的信息管理系统,用来规范管理日常办公流程,提高工作效率。在传统软件应用模式下,对于每个
相关向量机是一种基于稀疏概率模型的机器学习方法,与机器学习中分类回归领域得到了广泛应用的支持向量机在体系结构和功能运作上十分接近,从而较好地吸收了支持向量机泛化能
在实现嵌入式系统的过程中,软硬件协同设计技术通常需要考虑在缩短上市时间的基础上满足各种设计约束。协同设计的一个关键要求是对系统模块进行一个有效的软硬件划分,在满足功
近年来,基于云计算的互联网服务不断涌现,其中MapReduce计算范式和HDFS分布式文件系统已逐渐成为开发大型数据密集型应用的首选模型。从硬件供应商的角度,这类应用部署的规模如
多频生物电阻抗成像技术(MFBEIT)依据各组织对激励信号频率敏感性不同的原理,在多个频率激励下测量生物体内的组织阻抗信息,通过分析组织阻抗分布图像区分不同的组织或同一组织
近年来,部队车辆的数目不断增多,管理的难度愈加增大。传统的管理方式实时性差、安全性低,不能满足管理人员对访客记录的实时查询需求,此外,由于所有的记录采用的都是纸质媒
随着互联网技术的迅猛发展,每天由网络产生的数据量越来越庞大。互联网企业面对这些浩繁的数据,常常陷入数据丰富而信息贫乏的尴尬境地。MapReduce是Google提出的一种用于大规
血压是人体基本的生命特征参数,也是临床上重要的监测要素之一。血压监测结果给诊断疾病、观察治疗效果以及预后判断提供了十分重要的依据。现今,在手术室、重症监护室等医疗
随着互联网应用的不断丰富,网络流量需求与网络带宽之间的矛盾日益增大,网络流量管理的作用显得尤为重要。在“尽力而为”的服务模型下,P2P文件传输等非关键流量消耗着大量的带