基于长短型记忆递归神经网络的英文手写识别

被引量 : 0次 | 上传用户:datouuupp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字如人之衣冠,字体从符号演变成语言,见证且代表着人类文明的演进。在科技进步的今天,转化这些历史悠久、内涵丰富、图形符号为适用于现代计算机技术终端的载体,将是手写识别的崇高使命。手写识别虽然历经了超过30年的研究岁月,但在无约束手写串的识别方面仍然存在很大的挑战,它的难点在于我们很难从潦草的手写串中分离出独立的字母。故本文主要研究一种不需要分割的无约束联机英文手写词组识别方法。本文的主要研究工作和贡献的包括:1、实现无约束英文手写的预处理及特征提取,预处理技术包括倾斜校正、大小归一化、重采样、平滑处理、添加虚拟笔画。2、基于一种特定的递归神经网络结构:双向长短型记忆递归神经网络(BidirectionLong Short Term M emory Recurrent Neural Network,BLSTM)。BLSTM是一种多激活的神经元,通过输入输出、重置激活能使递归神经保持长时间的记忆。在训练时,输入数据不需要另外采集,也不需要分割技术;3、文中将采用一种动态连接技术(Connection Temporal Classification,CTC)将BLSTM的输出连成单词。文中提出三种不同的解码算法:基于Levenshtein距离,全路径(Full Path,FP),最大路径(MaxPath,MP)。4、文中收集了三个数据库:IRONOFF、Unipen-CDROW和Unipen-ICROW。本文还对常用词汇数据库通过仿射变换等技术,模拟不同的笔者,产生伪样本,增加数据库的多样性,通过这种方法,实验结果有明显提高,证明了伪样本技术的有效性;本文的BLSTM-CTC-FP被证明能有效处理基于字典的手写英文单词识别任务;其中在IRONOFF的数据库中,它比现有的最好模型减少了50%的错误率。
其他文献
滚动轴承广泛应用于旋转机械中,并起着关键作用。轴承失效可能带来巨大的经济损失或重大事故。因此,开展滚动轴承的状态监测与故障诊断是十分必要的。目前主要是通过振动分析法
目的:采用高效液相色谱法测定黄芩、葛根及其制剂御感袋泡茶中黄芩苷和葛根素的含量,评价该制剂的质量。方法与结果:黄芩苷测定以KYWG-C18为固定相,0.5%磷酸-甲醇-N,N-二甲基甲酰胺(13∶10∶1)为流动相,UV检测
我国逐渐逼近环境安全的底线,已形成有史以来,对环境污染和生态破坏最为严重、影响最深的程度。自人们注意到垃圾对生活的影响并开始对它给予处置以来,其处置方式多以堆填、焚烧
目的:为防治化工生产由于接触焦油、沥青、蒽酮、萘酚等化学物质引起的全身瘙痒、皮炎而研制的有效制剂。方法:选用中药白鲜皮、凌霄花、甘草,提取其有效成分,与表面活性剂配制成
<正>一、不食人间烟火的原理《西游记》智商最高的妖怪我以为当属白骨精,她似乎深谙《孙子兵法》中攻心为上的道理,知道不是孙悟空的对手,就采取了离间的策略。她的三次变化,
本文构建了一个以环保产业集聚绩效为被解释变量,集聚企业内部能力、集聚网络特征、产业环境等几组变量为解释变量的计量模型,并选取宜兴环保产业集聚区的60家企业进行问卷调
对东风电网中无功补偿装置装设在不同位置时所获得的经济收益进行了分析计算.首先按电厂在最小运行方式而电网的负荷最大的情况下计算出东风电网的最大无功缺额,然后就其补偿
20世纪80年代以来,全球产业结构呈现出“工业型经济”向“服务型经济”转型的总趋势,现代服务业在知识经济和经济全球化发展过程中,正发挥着越来越重要的作用。现代服务业具
课堂提问是授课过程中师生互动的一种惯用的教学技能,也是实现课堂学习目标的主要方法之一。一节课教学效率的高低,在很大程度上取决于教师能否成功地引导学生发现问题、思考
随着经济社会的发展,在缺乏有效环境保护政策约束下,人类活动对自然环境造成的破坏和影响加剧,生态系统变得十分脆弱,保护生态环境和生物资源的需求越来越强烈,作为保护生物多样性