基于深度学习与MQDF相结合的手写汉字识别方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:epigeige
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的飞速发展,用户对便利终端设备的迫切需求,市场上纷纷出现各式各样的大屏幕手机、平板电脑,使得手写输入变得更加简单、方便。移动终端设备的出现在给手写识别带来的巨大商机的同时,也带来了更大的挑战,不仅要求识别精度高,而且要求识别速度快,适合各类用户书写习惯和各类设备硬件条件。  在手写识别中,提高单字识别的精度是基础也是重点,但是一些客观原因也造成了单字识别的难度,例如由于汉字的种类多,结构复杂,字形的多样化以及标注样本的有限。建立标注手写样本库过程繁琐,一定数量的标注手写样本库的获得需要耗费大量的财力,样本的校验工作也需要花费很多的精力和时间,因此手写汉字识别领域面临着巨大的挑战。但是,由于移动商业化的发展、手写终端的便利、各类手写应用的出现以及用户越来越依赖于手写输入的现状,通过一定的商业途径,获得用户各式各样的大量无标注手写样本对手写识别来说变得相对容易了,找到一种成本低、准确率高的手写识别方法变得尤其重要。在这种标注样本少,无标注样本多的情况之下,半监督的深入学习方法便能很好地发挥其优势。  本文将深入学习应用到手写汉字识别中,并结合传统的预处理、降维以及分类方法,提出了一种将 DBN与MQDF相结合的单字识别方法。深度学习相比其他的学习方法具有较强的表达能力,特别对结构复杂的手写汉字,能够用非常复杂的深度结构进行建模。本文中的提出的方法主要分为四个阶段:第一阶段,将在线或者离线数据进行规整化后,采用连续的NCFE八方向特征提取方法;第二阶段,将第一阶段得到的特征放到 DBN中进行构建、训练和粗分类;第三阶段,将第一阶段得到的特征进行降维;第四阶段,利用第三阶段得到的特征和第二阶段得到的候选类别用Modified Quadratic Discriminant Functions(MQDF)进行细分类。  最后,本文的方法在哈尔滨工业大学深圳研究生院 HIT-OR3C、中科院CASIA-OLHWDB1和华南理工的SCUT-COUCH2009手写数据集上进行实验。结果表明,相比其他方法,本文提出的方法对单字识别的准确率有了明显提高。
其他文献
随着多媒体、网络技术的飞速发展出现了大量图像信息,传统的基于文本的图像检索方法已经不能适应图像信息检索的要求,因而基于内容的图像检索技术(CBIR)逐渐成为目前的研究热
计算机技术的发展,给社会生活带来诸多便利。虚拟现实技术是一门综合了建模技术、计算机技术、图形技术等领域的新兴技术,具有沉浸感、交互性、想象力3I特性,广泛的应用在教
学位
在汉语中,省略是非常普遍的一个现象。对于汉语省略的研究,一直是自然语言处理领域的热门课题。汉语省略研究对于问答系统、机器翻译、信息抽取等领域有着至关重要的作用。本
在三维城市景观的计算机建模中,针对建筑物的三维建模是其中最重要的组成成分,近年来得到了计算机图形学和计算机视觉研究者的广泛关注。各种基于三维建筑物模型的3D建模软件在
自从1998年语义Web的理念和体系架构被提出后,这个被称为下一代Web的技术受到广泛关注,在近十几年,研究者对相关层面上的知识表示、推理、存储方式等进行深入研究,并逐渐地将
在全世界范围内,铁路的安全运输都是备受关注的问题。在现有的列控系统中,通常通过ATP系统来完成列车行进中的安全监控。但是当传统的信号系统发生故障或者ATP系统失效等情况出
知识表示是知识应用的基础,知识表示方法是否合理有效将会直接影响到知识的存储、维护和应用,因此,知识表示一直是人工智能领域的研究热点。  面向对象技术发展至今,已经从原来
测试序列的优劣直接影响到测试的质量,如何生成优秀的测试序列已是测试领域中较为重要的研究方向。UML语言是近年来面向对象系统开发应用较为广泛的工具之一,它具有易于表达
继2010年6月23日工信部将“物联网”规划纳入“十二五”专题规划之后,“物联网”成为工信部电信研究院发布的2010年度通信业十大关键词之一出现在2011年中国通信产业发展形势