论文部分内容阅读
字如人之衣冠,字体从符号演变成语言,见证且代表着人类文明的演进。在科技进步的今天,转化这些历史悠久、内涵丰富、图形符号为适用于现代计算机技术终端的载体,将是手写识别的崇高使命。手写识别虽然历经了超过30年的研究岁月,但在无约束手写串的识别方面仍然存在很大的挑战,它的难点在于我们很难从潦草的手写串中分离出独立的字母。故本文主要研究一种不需要分割的无约束联机英文手写词组识别方法。本文的主要研究工作和贡献的包括:1、实现无约束英文手写的预处理及特征提取,预处理技术包括倾斜校正、大小归一化、重采样、平滑处理、添加虚拟笔画。2、基于一种特定的递归神经网络结构:双向长短型记忆递归神经网络(BidirectionLong Short Term M emory Recurrent Neural Network,BLSTM)。BLSTM是一种多激活的神经元,通过输入输出、重置激活能使递归神经保持长时间的记忆。在训练时,输入数据不需要另外采集,也不需要分割技术;3、文中将采用一种动态连接技术(Connection Temporal Classification,CTC)将BLSTM的输出连成单词。文中提出三种不同的解码算法:基于Levenshtein距离,全路径(Full Path,FP),最大路径(MaxPath,MP)。4、文中收集了三个数据库:IRONOFF、Unipen-CDROW和Unipen-ICROW。本文还对常用词汇数据库通过仿射变换等技术,模拟不同的笔者,产生伪样本,增加数据库的多样性,通过这种方法,实验结果有明显提高,证明了伪样本技术的有效性;本文的BLSTM-CTC-FP被证明能有效处理基于字典的手写英文单词识别任务;其中在IRONOFF的数据库中,它比现有的最好模型减少了50%的错误率。