自然场景下的文本检测与定位

来源 :东北师范大学 | 被引量 : 1次 | 上传用户：velvet_flower

【摘要】

：

【作者】

：

班华

【出处】

：

东北师范大学

【发表日期】

：

2019年01期

【关键词】

：

文本检测 MSER 深度学习 Faster RCNN

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本在人机交互中扮演着重要的角色。图片中的文本所包含的丰富而精确的信息在基于视觉的设备中应用非常广泛,能够辅助设备获得更精确的物体和周边环境信息。随着智能机器人、无人驾驶、医疗诊断的飞速发展,文本的检测与识别已经成为定位和理解物体信息的重要途径。特别是近年来,各界学者开始关注图像中遮挡,尺度变化,模糊等形式文本的研究,以解决实际问题。传统的文档图像中的文本检测与识别已经日渐完善,但是文档中的文本通常是统一的颜色,水平排列。而在自然场景中,文本的文字大小是随意的,在图像中的排布方式也是未知,同时由于拍摄设备的角度不同、周围环境光照不足等因素,很容易出现文本与图像具有低的对比度而与背景融为一体的现象,因此自然场景中的文本检测与识别仍然存在着很多的挑战。文本检测作为文本识别系统的第一步,目的在于将图像中的文本区域以边框的形式进行有效的定位,其准确性对于提高后续识别系统的精度至关重要。因此,本文围绕自然场景中的文本检测开展了如下的工作:(1)在传统机器学习领域,提出了基于改进MSER的文本检测算法。算法首先通过限制对比度直方图均衡(CLAHE)算法结合最大稳定极值区域(MSER)快速定位出文本候选区域,之后根据图像中文本区别于非文本的一些特征来滤除非文本区域,同时结合笔画宽度恢复被误删的文本部分,得到最终的文本候选区域。随后,再对图像中的候选区域部分提取方向梯度直方图(HOG)特征,利用训练后的支持向量机(SVM)文本二分类器完成对非文本区域的二次过滤,从而检测到自然场景中低对比度和模糊文本。(2)在深度学习领域,针对于现有的文本检测方法存在着对于模糊、尺度变化剧烈和受到建筑物遮挡等问题,提出了一种基于改进的Faster RCNN自然场景文本检测方法。该方法用深度残差网络(Inception Resnet)作为文本特征提取网络对图像特征进行深度提取,然后对提取的文本特征上运用更适合小型文本的区域提案网络(Region Proposal Network,RPN)产生候选文本区域边界框,再将精调后的特征与候选文本区域边界框进行融合,最后采用Fast RCNN文本分类网络进行分类求解。该方法解决了图像中文本大小不一或者文本受遮挡的问题,与原始的Faster RCNN相比,本研究中提出的多级Inception ResNet网络模型可以提取更深层次的文本特征。提取的特征图由Reduction B,Inception resnet C和Avg Pool进一步稀疏表示,然后与文本特征映射下层网络获得的文本区域融合,以获取精确的文本区域。通过算法的设计、研究与实验,我们所提出的文本检测算法与之前的算法相比分别在算法的鲁棒性方面和检测小型文本方面实现了改进,同时在测试中也取得了比之前的算法更好的效果。

其他文献

深度强化学习中的值函数模型研究

深度强化学习是人工智能研究的热点领域之一,结合深度学习的感知能力和强化学习的决策能力,学界提出了基于深度模型的深度强化学习值函数模型,从而构造出合适的深度强化学习

学位

深度学习强化学习优势学习深度Q网络平均深度Q网络

汉越偏正式双音复合词对比研究

在汉语与越南语词汇里,偏正式复合词占有很大比重,偏正式双音节复合词占大多数。从汉越偏正式双音复合词根与词根之间的关系来看,主要有定中、逆序定中和状中等三种结构形式

学位

汉语与越南语偏正式双音复合词异同母语迁移

1，25-（OH）2D3改善内质网应激抑制H2O2诱导的MIN6细胞凋亡

目的:探讨1,25-二羟基维生素D3（1,25-dihydroxyvitamin D3,1,25-（OH）2D3）在糖尿病（Diabetes mellitus,DM）防治中的作用。1,25-（OH）2D3通过改善内质网应激（Endoplasmic reticulum stres

学位

125-二羟基维生素D3过氧化氢MIN6细胞内质网应激细胞凋亡

《黑暗昭昭》：一部关于现代社会的神话

威廉·戈尔丁是英国20世纪最著名的作家之一,于1983年获得诺贝尔文学奖,其长篇小说《黑暗昭昭》荣获英国最具声望的文学图书奖詹姆斯·泰勒·布莱克纪念奖。比起寓言,戈尔丁

学位

威廉·戈尔丁《黑暗昭昭》神话现代社会

四星绳系闭合系统自旋平衡构型设计与控制

绳系卫星系统是将两个或多个卫星利用柔性轻质系绳连接在一起的航天器系统,由于其特殊的结构,能够完成传统卫星无法满足的任务需求。基于Golay-3分布的四星绳系闭合系统由四

学位

四星绳系闭合系统自旋平衡构型设计构型指向保持构型变化控制

浒苔多糖对Diquat诱导小鼠氧化应激的影响及机制研究

机体在受到外界条件刺激时(高温、高湿、辐射及一些化学试剂的影响)都会产生大量自由基,自由基的产生会导致氧化应激反应的发生,从而影响动物生产性能,造成畜牧业严重的经济

学位

氧化应激浒苔多糖肠道肝脏谷胱甘肽还原系统

质子和氮分子碰撞过程的研究

重粒子碰撞在原子与分子物理、天体物理、等离子体物理和受控核聚变的研究中有重要的研究意义。重粒子碰撞过程包括激发、电离、电子俘获和电子损失等信息,它包含多个分支,如

学位

电子损失电子俘获电子离化含时密度泛函理论

轻度认知功能障碍患者执行功能的研究

目的:分析轻度认知功能障碍(mild cognitive impairment,MCI)患者的执行功能(executive function,EF)的量表检测结果,初步分析该认知域的测试结果在健康中老年人与MCI患者之

学位

轻度认知功能障碍神经心理学测试执行功能

从Sirt1/NF-κB通路研究糖肾方对糖尿病肾病大鼠炎症的影响及机制

目的:本研究在验证糖肾方药物作用的基础上,观察糖肾方对糖尿病肾病大鼠肾组织Sirt1、乙酰化NF-κ Bp65的表达及相关炎细胞浸润的影响,探讨糖肾方对糖尿病肾病大鼠肾组织的抗

学位

糖肾方糖尿病肾病Sirt1NF-κB p65炎症

JPM-4质子磁力仪研制与测量范围指标评价

质子磁力仪是一种高精度标量磁力仪,具有制造成本相对较低、稳定性好、易操作、易携带以及可在较恶劣的环境下工作等优点。目前,质子磁力仪被广泛应用于地球物理研究、考古勘

学位

质子磁力仪日变校正测量范围灵敏度技术指标评价

自然场景下的文本检测与定位

与本文相关的学术论文