基于深度卷积模型的手写中文文本识别

来源 :燕山大学 | 被引量 : 0次 | 上传用户:kunhodde
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本识别是指文本位置预测和文本内容解析,本文研究的手写文本包括手写数字和手写中文文字。传统的手写数字识别方法有支持向量机,最近邻和随机森林等,但手写数字纹理特征少,有效信息提取难度高,以上分类器的准确率并不高。传统的手写文本识别大多数是基于单个字符的,针对文本行的识别方法并不多见,且实现方式局限于图像预处理、字符分割、特征提取和分类器设计等环节的拼凑。总之,传统的文本识别方法和模型普遍使用浅层特征,未能从大规模数据中抽象学习共性特征,效果并不理想。针对以上问题,本文分析了手写文本识别的难点,提出了有效的解决方法并通过实验得以验证。主要研究内容包括:(1)提出基于改进VGG16(Visual Geometry Group)卷积网络的手写数字识别方法,将学习率退火算法融入SGD(Stochastic gradient descent)优化器中,优化了网络学习过程,在增强的MNIST(Mixed National Institute of Standards and Technology database)数据集上识别准确率提高到99.98%。(2)利用RRPN网络(Rotation Region Proposal Networks)解决了倾斜文本行候选区域提取问题,搭建RRCNN网络(rotation-region-based convolutional neural networks)实现倾斜文本行检测定位和回归,最后融入BLSTM(Bi-directional Long Short-Term Memory)网络实现文本行起始和结束位置的精确定位。(3)针对手写汉字书写风格多样和笔画粘连等问题,提出了无分割端到端文本行识别新方法。利用DCN网络(Deep Convolutional Networks)提取文本行特征序列,利用Multi-BLSTM(Multilayered BLSTM)网络学习文本序列上下文空间信息,结合Ngram语言模型(N grammar model)约束,经过联结主义时间分类CTC(Connectionist Temporal Classification)层进行特征序列转录得到文本结果,避免了图像预处理和字符分割的困难。在手写文本数据集HWDB2(Handwritten DataBase 2.0~2.2)上获得92%的准确率,证明了模型的优越性。最后给出本文研究内容在答题卡识别领域中的应用案例,为答题卡自动识别提出了思路和解决方案。
其他文献
分析了注射器活塞管的工艺特点,介绍了注射模结构及工作过程。模具结构设计合理,操作方便,使用寿命长,塑件达到技术要求。
“平常时候看得出来,关键时刻站得出来,危急关头豁得出来”,这是习近平总书记对党员应有样子的生动描绘,是党章关于党员义务的具体体现,也是永葆共产党人先进本色的根本要求。翻开
报纸
目的:探讨红花黄色素联合金水宝对原发性肾病综合征患者血脂水平及血液流变学的影响。方法:选择2016年8月-2017年6月本院收治的78例原发性肾病综合征患者,按治疗方法不同分为
目的探讨应用美罗培南对肝硬化(LC)并发上消化道出血(UGB)患者院内感染的预防作用,为防治医院感染提供参考。方法2015年1月~2016年1月我科收治的Child-Pugh B/C级LC并发UGB患
目的:研究雌激素、雌激素受体(ER)、孕激素受体(PR)与人类肺恶性肿瘤发生、发展之间的关系,探讨肺肿瘤内分泌治疗的可能性。方法:利用组织化学技术检测56例肺肿瘤组织标本ER、PR表达
目的:探讨对运动造成膝关节损伤患者实施心理护理对患者负性情绪的影响。方法:取2015年7月至2017年7月间本院收治的200例因运动造成膝关节损伤患者进行研究,根据患者护理方案
越野滑雪是我国冬季体育运动的弱势项目。在传统越野滑雪训练过程中,设备落后,经验主义盛行,科学意识淡薄,新兴科技手段得不到充分利用,导致比赛成绩难以有重大突破。研究发
介绍华南沿海不同区域的围海造陆工程实例,并通过对围海造陆工程不同陆域形成方案中地基处理效果、施工难度、投资以及工期的对比分析,探讨适用于华南地区的围海造陆方案,最
目的 观察儿科患儿在接受优质化护理措施干预后降低院内感染的效果。方法 研究对象为2018年1月-2019年8月在我院儿科接受治疗的患儿40例,通过随机数字表法将其随机分为A、B两
面对全球化、信息化的现实世界,管理制度的创新与改革为中小企业的发展,为企业降低生产成本,提高工作绩效,规范管理秩序,实现员工激励等奠定了坚实的基础。