基于卷积神经网络的自然场景图像文本检测方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:ahjockey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是当今社会中一种重要的信息传播媒介,准确高效的文字检测方法有助于人们分析和理解图像中的语义信息。自然场景下的图像文本检测方法主要分为传统的自然场景文本检测方法和基于深度学习的自然场景文本检测方法。传统的自然场景文本检测算法因为存在检测效率低和准确率低的问题正逐渐被基于深度学习的自然场景文本检测方法所替代。但是基于深度学习的模型通常具有较深的网络结构,各层网络在提取图像特征的过程中存在丢失重要特征的问题,同时自然场景下的图像具有复杂性和多样性的特点,这在很大程度上限制了模型的泛化能力和实用性。针对以上问题,本文提出一种基于卷积神经网络的自然场景图像文本检测方法,一方面通过关注和提取网络运算过程中的图像特征提高模型的鲁棒性和准确率,另一方面通过对模型算法进行优化,提升模型在复杂自然场景下的适用性。本文的主要研究工作如下:(1)提出了一种多粒度特征融合的自然场景图像文本检测方法。首先,结合多粒度认知思想对网络层进行粒度结构划分,提取特征网络中不同的粒度信息;然后将不同粒度信息进行特征融合,利用残差通道注意力网络增加对不同粒度信息的关注度;最后,通过计算网络输出的特征图得到多个预测文本框,结合非极大值抑制算法筛选得到最终的检测结果。(2)提出了一种基于卷积神经网络的任意形状文本检测方法。首先,为了更好地提取图像中的重要特征,采用多粒度特征融合网络提取出图像的特征信息;然后通过一种基于边缘检测的文本框回归算法根据上层网络输出的特征图对文字边缘计算,最后输出模型预测的边界框。实验结果表明,本文提出的模型在多个数据集中都取得了很好的效果。在几个常用的自然场景图像数据集上,本文模型在精确率、召回率等指标上都要优于对比方法。最后,本文以一个自然场景图像文本检测系统为例,测试了模型在实际自然场景图像下的文本检测能力。
其他文献
近年来,随着互联网的蓬勃发展和社交媒体的大量出现,创建了大批的用户生成内容。用户生成内容在情绪识别方面可以应用于信息咨询、舆论挖掘和维持社交关系等领域,那如何从用户生成内容中挖掘其有效的情绪信息,为高级人工智能的活跃发展助力,成为了一个比较热门的研究方向。基于此,基于对话的情绪识别也受到了越来越多学者的广泛关注。目前,基于深度学习的情绪识别方法取得了较好的研究成果,而引入自注意力机制可以进一步提升
多视图新闻数据聚类分析可以快速从海量新闻中获得有价值的信息,在舆情分析、个性化新闻推荐、情感分析、预警等领域能够得到较好的应用效果。当前的多视图新闻数据聚类分析存在以下几个问题:(1)新闻内容中的文本、图片和音视频等多媒体信息是由不同语义层次、不同粒度的内容概念进行描述的,若直接将各视图一视同仁地进行学习,将严重影响数据挖掘性能。(2)到目前为止,大多数方法都是在假设各视图是完备的基础上进行实验的
随着“一带一路”的建设,我国与欧洲及沿线国家的经贸往来发展迅速,对于物流的需求旺盛,贸易通道和贸易方式也在不断地丰富和完善,为中欧班列发展创造了良好的发展机遇,也对中欧班列的发展提出了更高的要求。但是也应该看到,中欧班列的发展仍处于初期,各地区都存在恶性竞争、货源同质、线路重复、地方保护主义严重等问题,这些问题限制了中欧班列运行效率,阻碍了中国“一带一路”建设的进程。因此,在中欧班列发展中实现各区
汽车智能辅助驾驶技术是改善现有交通问题的关键技术之一,环境感知模块负责为辅助驾驶系统的提供道路信息。车道线检测技术是感知道路车道线信息的主要手段,对道路识别、路径规划及规范驾驶等关键技术具有重要意义。随着汽车智能辅助驾驶技术研究的深入以及逐渐产品化,该技术与其他前沿技术的结合应用也成为当下汽车产业技术研究的热点。车道线检测的要求也随之变化,对车道线检测数量、贴合程度以及鲁棒性有了更高的要求。本文围
在信息时代,虽然人们可以共享资源开拓视野,但是海量信息也会让用户花费更多时间代价寻找满足自己需求的信息。正是为了解决用户选择困难的问题,个性化推荐才受到了广泛的关注。个性化推荐通过分析用户行为数据,标记用户的个性化偏好,向用户推送其可能感兴趣的信息。目前,个性化推荐面临的主要问题是数据稀疏,通过用户和项目额外的辅助信息来探索用户的兴趣模式是有效的解决方法之一。近年来,图卷积网络在图数据方面表现出强
目前国内现有的有毒有害气体浓度检测产品的体积与功耗方面有着一定的缺陷,因此研究、设计出低功耗、体积小以及高精度的有毒有害气体浓度检测系统得到了工业界和学术界的广泛关注。本文设计以现有产品以及技术为基础进行对恶劣环境的适应性改善与降低整机功耗,进一步保障人类的身体健康以及生命安全。本文首先回顾气体传感器的现状和发展情况,介绍国内外在有毒有害气体检测技术当中的相关研究,描述其未来的发展方向。在此基础上
在未来网络规划中,越来越多的通信场景发生在室内,通信的地位愈发重要。然而室内覆盖不均、系统容量不足一直是阻碍其发展的难题,室内分布系统是针对这些难题提出的解决方案之一。在部署室内分布系统时,采用同频组网方式可解决频率资源紧缺的问题,但是会带来同频干扰,从而影响系统整体性能,导致网络覆盖降低。因此,在室内分布系统的建设及部署过程中,考虑干扰协调问题具有实际意义。论文主要工作如下:1.本文针对Lamp
随着无线通信系统业务种类和数据量的大幅增加,当前社会对系统容量极限及处理速度的需求在日益增长。多输入多输出(Multiple Input Multiple Output,MIMO)技术可以在不增加系统带宽和发射功率的前提下达到更高的信道容量及速率,而MIMO无线通信系统的信道估计及信号检测较单天线系统却有着不小的实现难度,因此针对该方面的探讨仍是无线通信领域的热点。此外,目前深度学习在通信系统的网
高压电气设备绝缘故障发生时,经常伴随局部放电(Partial Discharge,PD)现象,如果不加以预防,严重时会导致短路等现象发生,危害电力设备的安全运行,造成巨大的安全隐患。为了提前发现高压电气设备中绝缘劣化现象,需要对绝缘设备进行监测。特高频(Ultra High Frequency,UHF)传感器具有接收范围广、抗干扰能力强和非接触式测量等优点,被广泛应用于监测现场。监测现场存在各种噪
随着通信技术的不断发展,移动设备的普及使得人们对位置服务有了较高的需求,如大型购物中心、商场、医院门诊等。室外定位技术最早的是全球导航定位系统(Global Positioning System,GPS),发展至今技术已十分成熟,但建筑物会阻碍GPS数据信号的传输,使其无法在室内定位技术中使用。因此,各个领域的迫切需求促使室内定位技术获得了快速发展的机会,然而因为室内环境的复杂性和多样性,室内定位