基于增量学习的中文手写书写者自适应技术研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:liongliong564
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一直以来,无约束的中文手写文字识别都是模式识别领域的一大难题,长期成为该领域的研究热点。虽然规范的中文手写识别技术已经取得了较大的发展,但如何在无约束的风格多样的中文手写识别领域中获得令人满意的识别性能(大约98%左右)就是一个与待解决的重要问题。另外一方面,随着iPhone, iPad, Android智能手机等针对个人消费者的手持设备越来越流行,书写者自适应技术越来越受到学术界和工业界的重视。因为,在实际应用中,在一台固定的设备(比如智能手机,平板电脑等)上使用手写识别相关应用的使用者往往是一个特定的用户,对于该用户来说,识别引擎能否在该特定用户的书写样本上取得好的识别性能要远比在所有用户书写的样本中取得好的平均识别性能更为重要。针对以上问题,本文致力于研究基于增量学习的书写者自适应技术,这种技术可以通过不断的对特定用户的书写风格进行自适应的学习,从而不断的提高该特定用户的识别率,使得用户获得“越写越准”的用户体验。然而这项研究工作面临着多项技术难题,包括,汉字结构复杂与书写风格多变的问题,增量学习技术与书写者自适应技术的融合,增量学习样本数量不稳定和数量过低的问题,在鉴别特征空间(Discriminative Feature Space)进行增量学习的问题,以及同时对特征变换和分类器等相关联的多模块进行增量学习的问题。本文围绕着这些难点对基于增量学习的中文手写书写者自适应技术展开了一系列的研究,主要工作包括:1.对中文手写单字识别进行了深入研究。包括了手写文字的预处理、特征提取和分类器的设计。在此基础上,本文对联机手写文字识别中的特征提取技术进行了深入的研究。在联机中文手写汉字识别技术中,虚拟笔画技术是解决联机草书识别问题的一项关键技术,但它同时也存在混淆部分汉字笔划的严重弊端。本文通过理论和实验,深入分析了虚拟笔画技术在大类别汉字识别时的利与弊,提出了两种用于改进虚拟笔画技术的算法。实验结果表明,采用本文提出的方法大大减少了虚拟笔画技术带来的弊端,同时也保留了该技术的优点,使得识别率得到了更进一步的提升。2.针对传统的基于切分的手写中文词组识别技术中,由于切分技术不成熟导致识别性能较差的问题,提出了一种基于整词识别的旋转无关的无约束中文手写词组识别技术。实验表明,该技术的性能要远远优于传统的基于切分的中文手写词组识别技术。与此同时,针对整词识别方法中数据库难以创建的问题,本文也提出了一种中文手写词组合成方法,该方法可以利用目前现有的手写单字样本合成手写词组样本。实验表明,通过利用该合成数据库训练的手写中文词组识别系统可以在真实的手写中文词组数据集上获得良好的性能,从而证明了该技术的有效性。3.在模式识别领域中,线性判决分析(Linear Discriminant Analysis, LDA)技术由于其良好的性能而收到广泛的应用。尽管增量的线性判决分析(Incremental Linear Discriminant Analysis, ILDA)技术也在数据挖据,人脸识别中有了相应的应用,但是基于ILDA的书写者自适应技术仍没有人研究。针对该问题,本文首次在中文手写文字识别的框架下,创新性的提出了一种基于增量的线性判决分析的中文手写书写者自适应技术。与此同时,针对ILDA技术中增量样本不足和不稳定的问题,在ILDA算法中引入了加权机制,提出了一种加权的ILDA算法(Weighted ILDA, WILD A).实验结果表明,通过利用ILDA或者WILDA技术对特定用户的书写风格进行自适应的学习,可以大大降低该特定用户的识别错误率,同时对其他一般书写者的识别性能影响很小。另外一方面由于WILDA技术可以很好的解决增量样本不足和分布不均的问题,因此其性能要优于ILDA算法。4.在中文手写文字识别领域,修正的二次判决函数分类器凭借其优良的性能得到了非常广泛的应用。本文将增量学习算法与该算法相结合,创新性的提出了—种增量的修正二次判决函数(Incremental Modified Quadratic Discriminant Fuction, IMQDF)方法,并与书写者自适应技术相结合,提出一种新的书写者自适应技术。并在此基础上将ILDA技术与IMQDF技术相结合,提出了一种基于ILDA和IMQDF的两级增量学习框架(我们称之为ILDAIMQDF技术),并将其应用到中文手写书写者自适应技术中。最后类似于WILDA算法,将加权机制引入到IMQDF和ILDAIMQDF算法中,提出了WIMQDF和WILDAIMQDF算法。实验表明,以上四种基于增量的二次判决函数的书写者自适应技术可以获得远胜于基于ILDA技术和传统的模版更新技术的书写者自适应技术的性能。而WILDAIMQDF由于将ILDA算法和IMQDF算法相结合,并引入加权机制解决了增量样本不足的问题,获得了最优的性能。5.尽管基于增量的二次判决函数的中文书写者自适应技术能够获得非常好的性能,但是其巨大的参数存储量大大制约了其应用范围和前景。针对这个问题,本文提出了一种基于K-L变换和子空间矢量量化的两级压缩技术,该技术能以牺牲较小的识别性能来换取大幅降低增量的二次判决函数技术的存储空间。通过实验表明,通过利用该技术可以将增量的二次判决函数技术的存储量从3755MB压缩到9.98M,大幅压缩了99.73%,而首候选和前10候选的识别率分别仅仅下降了1.56%和0.08%。总之,基于增量学习的中文手写书写者自适应技术的研究是一个涉及多个领域(手写文字识别、机器学习、图像处理)的综合研究项目。通过对特定书写者的书写风格的学习,可以将一个书写者无关的识别引擎转化为一个书写者相关的手写识别引擎,从而大大提高对特定书写者的书写样本的识别率,进而使用户获得更自然、更人性化、更好的用户体验。这些特点都表明了中文手写书写者自适应技术将是汉字手写识别技术未来的一个重要的发展方向。
其他文献
人事档案管理工作的重要性不言而喻,在保障人事工作的有序、稳定中发挥着巨大的作用。在当前形势下,随着信息技术的不断发展,人事档案管理也受到了相应的影响,传统的管理方法已经
语言是人类最重要的交流工具,而文字则是人类用来记录语言的符号。随着多媒体、计算机网络和语音识别技术的高速发展,文本语音匹配成为基于内容的音频和多媒体数据分析和计算
图书馆办公室在馆内档案管理工作中扮演着重要角色,肩负图书馆档案收集、掌管、传播、开发与利用的实际职责,在协调图书馆的多项工作中,起到其他职能部门所代替不了的作用。本文
主要研究非线性矩阵方程Xs+A*X-tA+B*X-tB=Q的正定解,其中A、B为n×n阶非奇异复矩阵,s、t为正整数,Q为n×n阶正定矩阵。文中给出了使得该非线性矩阵方程存在正定解的新的
现代水利工作的不断创新和发展,科学技术的进步以及法制建设的不断完善,水利工作在水利建设中将会发挥更直接的作用。水利科学技术工作成为水利工作的先锋军,其工作量和工作任务
<正>中央经济工作会议对2018年经济工作作出了高质量发展的重大部署,其中一些与司法审判工作密切相关,强调要支持民营企业发展,落实保护产权政策,依法甄别纠正社会反映强烈的
<正> 在某些施工场合下,例如:在狭窄路段和交通繁杂的热闹街道上进行推土作业、道路铺设及埋设气、水管道的沟槽挖掘;隧道掘进及拓宽;地下通道、车站等挖掘。工程量很大,但大
城市空间在城市化过程中重要性凸显,城市秩序需要考虑人的主体性,而城市权利的提出已然不是一个事实问题,而是关涉法律制度的变革。从古至今城市权利一直被认可,但不同国家和
<正>婴童经济的"千亿级"蛋糕无疑激发了整个业界对童装的渴望。不仅各大童装品牌严阵以待,成人装品牌也早已部署周全。太平鸟旗下童装品牌Mini Peace可谓其中代表,成立不过两
人脸识别技术是生物特征识别领域中的一个研究热点,其主要任务是根据人脸图像中的有效信息进行个体的身份识别。本文以代数统计为研究工具,在流形学习和子空间学习的基础上,