基于大规模无约束数据的书写者自适应的中文手写识别系统研究

被引量 : 0次 | 上传用户：godwin_z

【摘要】

：

中文手写文字识别一直以来都是模式识别领域的一个热点研究方向。同时，无约束的中文手写识别由于其用户书写风格的多样性及手写样本的多变性，长期成为模式识别领域的一大难题。

【作者】

：

高岩

【发表日期】

：

2013年期

【关键词】

：

手写识别增量学习联机手写数据库书写者自适应云手写识别系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

中文手写文字识别一直以来都是模式识别领域的一个热点研究方向。同时，无约束的中文手写识别由于其用户书写风格的多样性及手写样本的多变性，长期成为模式识别领域的一大难题。虽然规范的有约束的中文手写识别技术已经取得了非常大的发展，识别率已经达到98%以上，然而无约束的中文手写识别的识别率却远远低于规范的有约束的中文手写识别，识别率仅能达到93%左右。因此，使无约束的中文手写识别达到令人满意的识别性能就是一个急需解决的重要问题。现如今，诸如智能手机，个人掌上电脑，电纸书和平板电脑等带有触摸屏幕的手持电子设备非常流行和普及，这使得在这些电子设备上手写输入方法变得越来越重要。然而由于在实验室采集的手写数据非常有限而不能涵盖所有书写风格，导致在实际应用中手写识别率并不能达到令人满意的效果。尤其是对于某些特定用户，由于其特殊的书写风格，导致对这些用户的识别性能是难以接受的。针对以上的问题，本文致力于研究基于大规模无约束手写数据的书写者自适应的中文手写识别技术，这种技术采用大规模的无约束的手写数据来训练分类器，保证了训练样本中含有尽可能多的书写风格，进而满足大部分书写者的书写体验。同时，本文提出的用户自适应算法可以对特定用户的书写风格进行自适应学习，从而提高该用户的识别率，使该用户获得“越写越准”的用户体验。然而这项研究工作面临许多技术难题，包括，汉字书写风格多变的问题，汉字结构复杂并具有许多难以区分的相似字的问题，数据库的采集与整理的问题，增量学习中原始分类器词典的压缩问题，增量学习中对普通用户的识别率有所降低的问题，以及在鉴别特征空间(Discriminative Feature Space)进行增量学习的问题。本文围绕着这些难点对基于大规模无约束手写数据的书写者自适应的中文手写识别技术展开了一系列的研究，主要工作包括：1.针对中文手写单字识别技术进行了介绍和分析研究。包括手写文字的预处理、特征提取和分类器结合的算法设计等。在此基础上，本文提出了快速的手写识别系统和精确的手写识别系统。实验结果表明，本文提出的快速的手写识别系统的分类器词典大小仅为2Mb，而识别速度达到1.7ms/字。而精确的手写识别系统则可以明显的提高识别率，在SCUT-COUCH2009数据库上可以达到97.04%的识别率，而在CAISA-OLHWDB1数据库上则可达到93.57%。2.针对现如今公开的手写中文数据库手写样本数量有限，涵盖的书写风格和类别数太少的问题，本文采集和整理出了一套完整的无约束的手写数据库。该数据库涵盖类别非常广泛，包括简体单字、繁体单字、中文词组、汉语拼音、英文字母、阿拉伯数字、常用符号和联机文本行等手写数据。该数据库已完成了由190多人书写的完整的数据，字符总数超过3,600,000个。同时，该数据库是第一款公开的拥有大词汇量，高频中文词组和汉语拼音的联机中文手写体数据库，它为联机手写中文词组识别和手写拼音识别等研究领域提供了基础的数据。另外，我们还通过网络采集了大量真实的手写文字样本，总人数超过20万人次，而手写样本超过150,000,000个。这对中文手写识别的研究提供了有力的帮助。3.针对目前提出的增量的修正二次判决函数(Incremental Modified QuadraticDiscriminant Fuction, IMQDF)方法需要巨大的参数存储量，同时会降低对于普通用户书写的识别率的问题，本文提出了一种平滑压缩的IMQDF算法。这种平滑压缩算法可以大幅降低IMQDF算法所需的参数存储量，仅为原存储量的1/50,同时还可以相对提高对于该特定用户和其他普通用户的书写识别率。同时，本文还提出了一种基于特征子空间的IMQDF算法，这种算法可以快速的将MQDF分类器变换到新的子空间中，大大的降低了运算时间。4.针对目前许多先进的手写识别算法由于其运算复杂，存储量大等原因，无法在电子设备中应用的问题，本文提出并设计了一种基于云计算平台的手写识别系统。由于云服务器端的强大的计算能力以及足够大的存储空间，更加精确的手写分类器以及用户书写自适应系统等许多先进的手写识别算法得以应用其中。因此不仅可以提高普通用户的识别率，还可以使特定用户获得“越写越准”的用户体验。总之，基于大规模无约束手写数据的书写者自适应的中文手写识别技术的研究是一个涉及手写文字识别、机器学习、图像处理和增量学习等多个领域的综合研究项目。通过对特定用户的书写风格的增量学习，可以大大提高对该用户的书写样本的识别率，同时可以不降低对于其他普通用户的识别率，这可以让所有用户获得更人性化的用户体验。这些特点都说明用户自适应的中文手写识别技术将是中文手写识别的一个重要的发展方向。

其他文献

工程化的人抗人IgE抗体的制备

目的：重组人IgE C3-C4抗原,获得其特异性的高亲和力工程化的人抗体及人源化的鼠单克隆抗体。方法：用PCR的方法获得人IgE C3-C4基因,与原核表达载体pET-19b连接得到表达质粒并在

学位

单克隆抗体人源化工程化人抗体IgE溶组织内阿米巴重组蛋白血清流行病学调查logistic回归模型无气门螨类鉴别内转录间隔区2细胞色素氧化

进城务工人员随迁子女行为习惯的调查及教育对策研究

随着中国改革开放的深入和社会经济的发展，农民工正逐渐成为中国产业工人的重要组成部分。进城务工人员随迁子女教育问题是我国大中城市所面临的一个新问题。近年来，随着国家政

学位

进城务工人员随迁子女养成教育行为习惯调查对策

跨文化背景下的中英称赞语对比研究

作为现代语用学的核心内容，言语行为理论自20世纪50年代由John.J.Austin提出后，引起了国内外许多哲学家和语言学家的极大兴趣，他们开始从不同方面致力于对言语行为理论的研究。

学位

称赞语言语交际跨文化交际文化对比

复杂条件下颗粒物料管道水力输送机理试验研究

本文以长距离管道输送和深海采矿等实际工程条件为研究背景,系统总结分析了前人的研究成果,通过自行设计的管道输送模拟试验系统对复杂空间形态、复杂组成物料两种复杂条件下

学位

复杂条件临界流速流变特性水力坡度固液两相流

基于ERP平台对我国企业集团资金管理的流程改造

随着我国企业的飞速发展，企业集团已逐步成为我国经济体系中的主体，与此同时，其在经济体系中所发挥的重要作用也在不断地提高。但是由于我国近几年发展起来的企业集团大多注重于

学位

企业集团资金管理ERP流程重组

浅析当代大学生青年志愿者服务

为了使大学生青年志愿者服务和团学工作得到更好的发展,本文从现状问题出发,并对问题进行浅析,阐明问题存在的原因所在。基于对大学生参与青年志愿者服务的社会意义和个人意

期刊

大学生团学工作青年志愿者服务全面发展

湖南西部苗族地区的现代农业研究

当今,世界各国现代农业的发展所带来的良好的经济效益和社会效益正在为各国各地区的实例所一一证明。因此,发展现代农业也就成为民族地区农业发展的大趋势。值得注意的是,我

学位

湖南西部苗族现代农业可持续发展

非英语专业本科学生口语语用失误调查与分析

长期以来,由于教师教学理念、教学水平,学校教学条件,以及社会大环境对大学英语的要求等主、客观条件的限制,对大学生语用能力的培养并未受到应有的重视。因此,本研究旨在通

学位

口语语用失误口语语用能力培养大学非英语专业本科学生大学非英语专业本科英语教学

承重保温夹芯无拉接件的复合墙体的研究

随着我国建筑节能工作不断深入和完善，特别是建筑节能设计标准体系的建立，对外墙的传热系数和热惰性指数有了明确的要求。但在所有的新型墙体材料中，只有加气混凝土是良好的节能

学位

承重保温夹芯复合墙体引气型全轻轻集料混凝土泡沫混凝土墙体力学有限元分析无拉接件设计热工性能生产工艺设计

加工巴西大豆和美国大豆的综合效益评估

根据采用国产设备加工巴西大豆和美国大豆的体会,从生产经济效益方面进行评估,加工每吨巴西大豆比美国大豆综合效益增加5.36元。巴西大豆含油高、含水高,加工特性是皮软、黏

期刊

巴西大豆美国大豆综合效益评估

基于大规模无约束数据的书写者自适应的中文手写识别系统研究

与本文相关的学术论文