论文部分内容阅读
脱机中文手写体识别技术可以将人工书写在纸上的汉字转换为电子文档中可编辑的中文格式.由于每个人的书写习惯不同,所以手写体随意性较大、字符之间可能存在粘连,给字符分割增加了难度.为了避免单个字符的分割,本文采用基于Attention的方法实现脱机中文手写体文本行的识别.该方法基于encoder-decoder框架,首先用CNN提取特征,然后通过BLSTM进行编码,最后将BLSTM的输出结果再结合Attention,输入到LSTM进行解码.该方法在针对具有语义信息的CASIA-HWDB2. 0-2. 2数