基于深度学习的自然场景图像文字检测与识别技术研究

来源 :北京工业大学 | 被引量 : 4次 | 上传用户：qingsong009

【摘要】

：

现实中,网络是人们获取新闻的一个重要渠道,不少新闻软件会根据用户的喜好推送相应的文章,因此需要对文章进行”描述”即标注文章的画像。传统的方法大都是人工标注,这样做成

【作者】

：

王博超

【出处】

：

北京工业大学

【发表日期】

：

2018年01期

【关键词】

：

光学文字识别图像检测图像识别图像处理深度学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

现实中,网络是人们获取新闻的一个重要渠道,不少新闻软件会根据用户的喜好推送相应的文章,因此需要对文章进行”描述”即标注文章的画像。传统的方法大都是人工标注,这样做成本过大、可能造成疏漏。据统计,每篇文章中几乎都会有至少三幅自然场景图像,这些图像的文字信息可以很好地帮助我们”理解”文章内容,这为标注文章画像发挥着重要作用。因此,本论文将光学字符识别(Optical Character Recognition,OCR)技术用于识别文章图像中的文字,并提出了一套全新的算法,本论文的主要工作内容如下。1、面向文字检测与识别的复杂自然场景图像预处理。自然场景图像大小不一,不同图像中文字位置各异。因此,首先对图像进行尺度的规范,之后用最大稳定极值区域算法(MSER)对图像对比度最大的通道进行预处理,选出可能是文字的区域,最后对选出的区域进行区域去重。2、设计并搭建了一个用于自然场景图像的文字检测网络模型。针对图像特点,对预处理步骤得到的图像区域设计了一个检测网络,用于识别文字区域并去除非文字区域。该网络的训练数据总量为12万,其中4万正样本,8万负样本。它是一个浅层网络,由卷积层、池化层、全连接层以及Softmax层组成,它可以在保证运行效率地情况下最准确地对文字区域和非文字区域进行二分类。实验结果表明该模型的准确率为93.5%,误检率为2.5%,召回率为88%。3、设计并搭建了一个用于自然场景图像的文字识别网络模型。对检测得到的文字区域进行行规并,然后设计了一个深度神经网络用于光学文字识别。该网络的训练数据总量近800万,涵盖14300个汉字维度。该网络由CNN串联RNN构成,其中CNN可以感知文字的形状,而RNN可以学习上下文的关系。整个网络由卷积层、池化层、Batch Normalization(BN)层、Long Short-Term Memory(LSTM)层、全连接层以及Connectionist Temporal Classification(CTC)层组成。实验结果表明该模型的准确率是91.97%。并且,本论文的文字识别采用无词库(Non-Lexicon)的方式,不受词库大小的限制。所用识别数据使用改进的GitHub开源工程进行人工生成,因此无需人工标签,并且理论上可以无限生成。

其他文献

论小学语文探究性学习的意义及实施策略

【摘要】《语文课程标准》指出：要“尊重学生在学习过程中的独特体验”，“着重培养学生的语文实践能力”，“积极倡导自主、合作、探究的学习方式”。而探究性学习恰恰是一种积极的学习过程，它可以激发学生学习兴趣和学习动机以及求知欲，提高学习兴趣，提升学习层次，拓展眼界。　　【关键词】小学语文；探究性学习；意义；策略　　【中图分类号】 G62.25【文献标识码】 A【文章编号】 2095-3089（20

期刊

小学语文探究性学习意义策略

基于工作过程的《订单执行与供应商管理》课程设计初探

结合柳州职业技术学院物流管理专业核心课程《订单执行与供应商管理》改革的实践，按照基于工作过程的课程设计理念对课程教学方案设计、教学模式和考核方案进行了针对性探讨。

期刊

工作过程课程设计教学模式考核方式working process curriculum design teaching mode assessment

针药结合治疗类风湿关节炎的临床研究

目的：探讨针药结合治疗类风湿关节炎的临床效果。方法：选择于2010年10月-2012年10月在我院治疗的60例类风湿关节炎患者,随机分为治疗组与对照组,每组30例,治疗组采用针灸治疗＋口

期刊

类风湿关节炎针药并用健脾化湿通络汤rheumatoid arthritiscombined acupuncture and medicinespleen

降脂利刃——立普妥

据世界卫生组织调查，心脑血管疾病及癌症已经在疾病造成死亡的原因中排前两位。而高脂血症就是引发心脑血管疾病的最重要原因之一。但是。在全球患有高脂血症的患者中，只有35％的

期刊

心脑血管疾病降脂世界卫生组织高脂血症原因病情

基于遗传算法的教学任务分配的设计与实现

建立教学任务分配的优化模型,结合遗传算法自适应搜索优化解的特点,给出了其遗传算法实现的方案。算例表明,其模型与算法是有效的,能在理想时间内找到最优解。

期刊

教学任务分配优化模型遗传算法teaching assignment distribution optimization model genetic alg

强化管理促发展不懈努力为百姓——奉贤区海湾镇社区卫生服务中心简介

奉贤区海湾镇社区卫生服务中心位于奉贤区杭州湾北岸、奉贤区南端，辖6个居委，服务人口2．5万。中心占地面积5676km^2，设有预防保健科、全科医疗科、康复医学科、中医科、医学检验

期刊

社区卫生服务中心奉贤区强化管理全自动生化仪基本医疗设备预防保健科全科医疗科康复医学科

宪法的威仪与温度

<正>无论是宪法宣誓、纪念国家宪法日,设立"五四宪法"历史资料陈列馆,还是对法规和司法解释进行备案审查,都是对宪法精神的诠释。2016年2月26日,十二届全国人大常委会第十九

期刊

张德江国家工作人员宪法宣誓全国人大常委会

男人的顶上问题

据一项关于男性脱发的调查显示．我国男性脱发发病率不断提高，并出现低龄化趋势，中青年成了“脱发大军”的主力。60％的男性在25岁前就开始脱发。在30岁前开始脱发的比例近84％。除了

期刊

男人遗传因素生活方式脱发发病率男性

山东省造纸工业2014年发展概况

2014年,山东省造纸工业通过积极＂转方式、调结构、促转型＂,实现了生产经营的稳定向好发展,主要经济指标连续20年居全国前茅。根据行业协会汇总分析,2014年山东省造纸工业发展概

期刊

造纸工业印刷技术印刷设备纸品

正念认知训练对高一学生安全感的影响研究

正念(Mindfulness)是一种通过将注意指向当下目标而产生的意识状态,不加评判地对待此时此刻所展开的各种经历或体验的觉知。正念的思想是从两千多年前的佛教思想中发展而来,

学位

正念认知训练安全感高一学生

基于深度学习的自然场景图像文字检测与识别技术研究

与本文相关的学术论文