论文部分内容阅读
在科技日新月异、信息化飞速发展的今天,手写藏文识别的研究还处于起步阶段,藏族同胞手机中的输入法软件还停留在全键盘模式,浩如烟海的藏文文献典籍数字化工作仍亟待进行。小至藏族同胞的生活需求,大到少数民族文化的传承,都离不开手写藏文识别技术的发展。因此,研究手写藏文识别技术对少数民族非物质文化遗产的保护具有重大意义,是我国文字识别工作者义不容辞的责任。本文介绍了藏文识别的研究现状,分析了藏文的特征与识别难点。由于在实际应用中,藏文以音节字作为书写单元,因此,本文首次对手写体藏文音节字识别技术,进行了较为系统的理论和实验研究。本文将基于特征提取的文字识别方法和基于深度学习的文字识别方法,应用于藏文音节字识别研究中,并取得了以下主要研究成果:1.在藏族同胞的协助下,本文根据藏文音节的字母组合动态比率数据,统计出579种常用的藏文音节字,并采集了60套手写藏文音节字样本,建立了包含34740个藏文手写音节字样本的数据库。2.本文将特征提取文字识别方法应用于手写藏文音节字识别中。在预处理步骤中,为了保留藏文音节字的结构信息,本文提出了基线上下线性归一化方法,并将该方法与非线性归一化、平滑处理、插值和重采样进行结合,最大程度地保留了手写藏文音节字的原始信息,滤除了冗余信息,便于特征的提取与分类识别。在特征抽取步骤中,本文根据手写体藏文音节字自身的书写特点,提出了将上元音特征和八方向线素特征相结合的特征识别方法,并应用于藏文手写音节字的识别研究。在分类器设计步骤中,为解决藏文音节字由于元音符号区别较小而造成相似字多、识别率低的难题,以及考虑到移动平台这个比较特殊的开发环境,本文提出了将上元音特征作为粗分类器,与欧式距离和MQDF分类器进行级联的三级分类器设计方案。3.本文通过实验对比了欧氏距离和三级分类器级联的识别效果。采用三级分类器级联时,前三平均识别率为94.18%,前五平均识别率达到了96.45%。实验结果表明,本文算法识别效果较好。本文对基于特征提取的算法进行性能测试后,将算法移植至移动终端,采用谷歌推出的输入法框架Android Input Method Framework进行手写输入法软件开发,完成了基于安卓系统的全手写藏文输入法软件。4.本文将基于深度学习的文字识别方法应用于藏文手写音节字的识别研究中。本文在经典手写数字识别网络LeNet-5模型的网络结构上进行改进,通过调节网络结构和参数,使网络性能达到最优,实验结果表明,最高识别率达到了91.2%。