端到端的自然场景文字检测与识别神经网络的研究与实现

来源 :上海师范大学 | 被引量 : 0次 | 上传用户：between930

【摘要】

：

【作者】

：

陈桂安

【出处】

：

上海师范大学

【发表日期】

：

2019年08期

【关键词】

：

图像处理计算机视觉文字检测与识别深度学习神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文字,在我们的日常生活中无处不在,是人们之间交流、信息传递和互动的主要方式之一。近年来,自然场景光学字符识别(optical character recognition,OCR)技术,即把手写体或图像上的文本换为机器编码的文本已成为模式识别、人工智能和计算机视觉领域的热点研究方向,学术界和工业界对此都有很强烈的关注。作为一种通用技术,自然场景文字识别不需要定制特殊场景,并且可以识别任何场景图像中的文本,如广告牌、路标、车牌、文档照片、商品包装等。自然场景文字检测与识别技术已广泛应用于信息内容安全审计,票证识别,证件照片识别等方面,具有极其重要的研究和应用价值。本文论述了自然场景文字检测与识别技术的研究背景和意义,阐述了自然场景文字检测与识别技术的研究现状,重点介绍了场景文本检测与识别算法,并设计了一个端到端的可训练的文本定位深度学习网络,可以同时检测任意方向的文本行和识别文字,并在标准数据集上对场景文字检测与识别算法进行了验证。本文主要做了以下工作:1.本文设计了一个统一的端到端的深度学习网络,同时完成文字检测和识别的任务,该网络可以进行端到端的训练。与分别用两个网络完成这两个任务的方法相比,本方法通过卷积神经网络学习更多的通用特征,卷积神经网络在文本检测和文本识别之间共享,两个任务的监督是互补的。由于特征提取通常需要大部分时间,因此它将计算收缩为单个网络的时间。2.在场景文字检测方面,本文论述了已有的基于深度学习的算法EAST,并对算法存在的问题进行了分析和改进,解决了EAST因感受野的限制而无法检测长文本的问题,同时为了增加模型对更复杂情况的鲁棒性用Resnet50作为基础网络。3.在文字识别方面,本文使用卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)作为编码器,连接的时序分类器(Connectionist Temporal Classification,CTC)作为解码器来做文字识别分支,为了使得输入序列大于输出序列这里CNN中的池化层的滤波核为2×1。4.使用仿射变换提取感兴趣区域(Region of Interest,Ro I),这是结合检测分支和识别分支的关键,仿射变换从共享特征图上提取检测分支检测到的任意方向的文本行对应的特征,送入识别分支进行文字识别。5.结合本文对场景文字的检测算法和识别算法的研究成果,基于Keras和Tensor Flow实现算法并在多个标准数据集上进行了测试和验证。实验表明,本文设计的场景文字检测和识别算法有较好的鲁棒性,算法能够实时处理自然场景图片,能够准确定位图片中文字的位置,并对文字进行检测和识别,算法准确率达到了最先进水平,具有较强的研究和应用价值。

其他文献

腰间盘突出旋切介入术后应用酸痛灵的临床观察

<正> 腰间盘突出症是一种常见多发病,是引起腰腿痛最常见的原因。经皮电动旋切髓核摘除介入术作为治疗腰间盘突出症的新方法已经越来越多地被广大患者所接受。此技术具有安全

期刊

酸痛灵止痛药间盘突出介入术后临床观察

模内覆膜装饰制品质量缺陷影响因素分析

随着人们对产品外观表面质量的要求越来越高,模内覆膜装饰技术逐渐成为表面装饰技术的热点,已广泛地应用于对产品外观要求较高的消费性电子产品及汽车内饰件等产品上。根据国

期刊

质量缺陷模内覆膜翘曲变形

谈JCI中的医疗设备预防性维护

本文阐述了我院在JCI（国际医院认汪联合委员会）标准认证前，根据JCI标准制定了医疗设备预防性维护的制度、计划，临床工程师设计了医疗设备预防性维护模板，并据此开展预防性维护，记录

期刊

JCI医疗设备管理预防性维护

雪被期川西高山林线交错带两种地被物凋落物分解与土壤动物多样性

以针叶林代表性地被植物锦丝藓和高山冷蕨为研究对象,采用凋落物分解网袋法,研究了高山林线交错带(暗针叶林-林线-高山草甸)的锦丝藓植物残体、高山冷蕨凋落叶及混合凋落物经

期刊

土壤动物多样性锦丝藓高山冷蕨质量损失率雪被期高山林线交错带

不同坡度和前期土壤含水率下裸地和草地的降雨产流试验分析

坡度和前期土壤含水率是降雨产流过程的重要影响因素。为探讨其对降雨产流过程的影响,采用人工降雨模拟试验,对太行山前平原区不同坡度和前期土壤含水率下草地和裸地降雨产流

期刊

裸地草地坡度前期土壤含水率降雨产流

气浮+生物接触氧化法处理饮料废水的技术研究

饮料废水可生化性较好,采用气浮＋生物接触氧化法处理饮料废水。采用气浮工艺作为物化处理单元,可以去除大部分不溶性有机物和悬浮物,再通过生物接触氧化后续生化处理,可以使CO

期刊

饮料废水气浮生物接触氧化法CODCr

肝细胞性肝癌淋巴结转移的临床病理分析

目的探讨原发性肝细胞性肝癌淋巴结转移的临床病理特点.方法对1998.1～2003.3经手术治疗的22例肝细胞性肝癌淋巴结转移的临床病例进行回顾性对照分析.结果临床表现、发病年龄、

期刊

肝细胞性肝癌淋巴结转移病理特点

世界女子100m跑优秀运动员成绩演变及运动参数模式

对近20年世界女子100m跑成绩演变和1997年田径世锦赛女子100m跑成绩数据(100m各段落跑速、步长、步频、步数)进行了分析，结果认为，世界女子100m短跑优秀运动员成绩近20年稳步提

期刊

100m跑最高速度步幅步频女子运动员

船舶自动识别系统中的无线局域网通信技术研究

现有的船舶自动识别通信系统(AIS)主要用于VTS领域船舶报文的传输,其无线通信网络采用STDMA技术,信道负载率符合通信网络性能要求。随着海上船舶电子设备及业务种类的增加,通

期刊

无线通信系统通信性能仿真AIS

提高小学英语词汇教学实效策略探析

词汇教学是英语教学中非常关键的环节。而在以往的词汇教学中小学生往往没有浓厚的兴趣,觉得学习单词是一件十分枯燥的事情,也找不到适合自己的学习方法。为了提高学生的单词

期刊

提高小学英语词汇教学实效

端到端的自然场景文字检测与识别神经网络的研究与实现

与本文相关的学术论文