基于改进的Faster R-CNN目标检测研究与应用

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:jinger1999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测作为计算机视觉领域的一个重要研究方向,其对目标的定位和识别性能被广泛应用于各个领域,无论是无人驾驶,交通管制还是机械制造,目标检测均做出了应有的贡献。但随着对目标检测的需求越来越高,对检测的性能也提高了要求。当前传统的方法尽管能对目标进行有效识别和定位,但仍存在检测精度低、漏检和误检的现象。因此,基于以上提出的缺陷,先对目前目标检测的各种技术进行综合性的分析和比较,对他们的研究进一步了解。两阶段的Faster R-CNN模型进行研究,然后根据该模型存在的问题,对部分插件进行优化,提出相应的改进措施和方法。通过实验证明,最后的检测模型比较原来模型有效的提升mAP检测精度,并且降低了漏检和减少误检,同时提高了定位精度。本文工作具体如下:1、为了解决原始的Faster R-CNN对特征图全局特征提取不完整、无关特征弱化明显的问题,模型引入注意力机制,提高检测模型对于全局特征的检测能力,加大局部特征之间关联性和类似特征的鉴别性,从而使模型的整体检测性能得到提高。2、针对CBAM双通道注意力机制在相邻全连接层网络上形成了类似瓶颈的连接口,这样的连接口会使检测的特征信息造成局部丢失的现象,于是重新组建了一个卷积神经网络和CBAM连接的通道,重新组建的通道摒弃了瓶颈结构,而是直接从始端到终端不降低维度的通道,然后将其串联。不仅能够避免维度降低,而且能够保证通道之间的互通性。3、为了进一步提升模型的检测性能,通过引入ROI-Align将anchor中的feature map映照为统一尺寸的特征图。除此之外,本文利用柔和的非极大值抑制算法(Soft-NMS)可以有效降低重叠遮挡的特征图漏检的优势来替换非极大值抑制算法(NMS),实现特征检测时降低漏检数目。4、验证改进的算法的实用性,将算法和检测系统进行结合构造出引入注意力机制的Faster R-CNN目标检测系统。
其他文献
在新媒体时代,人们的出行决策时刻受到社交媒体中口碑信息的影响,旅游目的地品牌推广的主要途径也逐渐从非社交媒体转变到微博、微信和抖音等社交媒体上。旅游目的地如何通过社交媒体平台来创建旅游品牌,并与游客建立起长久而稳定的品牌关系,是当前旅游发展重要的问题。本论文主要对宁夏旅游目的地品牌的社交媒体传播现状,以及优劣势、机遇与不利因素进行分析,提出提升宁夏旅游目的地品牌传播水平的思考和建议。笔者在梳理宁夏
学位
三维人脸重建技术在计算机视觉领域中是一种非常重要的研究方向,在3D游戏,虚拟现实,和元宇宙等方向有非常广泛的应用前景。传统的三维人脸重建算法都是基于3DMM模型的改进,通常估计先验模型的形状,纹理,表情参数获取三维人脸结构模型,对面部细节和高频特征的三维表达存在缺失,重建出的模型都趋于平均模型,细节特征不明显。为了重建出模型具有明显的细节特征,无模型的方法成为了重点的研究方向,但是现有的无模型重建
学位
制造业作为实体经济的重要基础,是我国的立国之本、强国之基。随着全球竞争加剧,国内制造业面临新的挑战。伴随着复杂的工况和实时生产的扰动性,使得制造业生产面临更多的挑战,需要我们紧跟新制造概念的发展,解决实际制造过程中存在的动态不确定性、复杂性以及实时响应性问题。然而,生产调度作为制造系统的基础,生产调度的优化是先进制造技术和现代管理技术的核心。作业车间调度问题是一类基础而复杂的生产调度问题,针对以上
学位
随着互联网与智能终端的发展,越来越多的数据被产生,面对大量无规则且复杂的数据如何从中提取有用信息是目前迫切需要解决的问题。聚类作为数据挖掘领域核心方法之一,可以将无标签的数据进行划分,因此,广泛被应用于多个领域。为了顺应时代的需求,越来越多的聚类分析方法被提出,其中,密度峰值算法(DPC)具有输入参数少、对数据集分布的状况和噪音数据都不敏感以及聚类效率高等优势,使得该算法自发布以来备受国内外学者关
学位
文化生态保护实验区是整体保护“活文化”和文化生态的一种有效方式。本文通过分析陕北文化生态保护实验区内的非遗资源,分别从非遗资源特征、空间分布特征两方面进行研究分析,衡量陕北地区非遗资源是否适宜转化为旅游产品,在陕北全域范围内分析得出不同程度旅游开发适宜性的县区,为陕北国家文化生态保护实验区非遗的旅游开发提供依据,促进陕北地区非遗资源的保护与发展。通过适宜性评价,最后得出延安市宝塔区的旅游适宜性水平
学位
随着当前社会矛盾的日益突出,城乡居民消费结构的进一步升级,葡萄酒产业市场前景广阔,“葡萄酒+旅游”新业态呈现巨大发展潜力。面对新时代新机遇,我国的葡萄酒产业完全可以大有所为,并形成千亿级规模的产业集群,这不仅是贯彻落实习近平总书记对宁夏乃至中国葡萄酒产业重要指示,也是实现中国葡萄酒“当惊世界殊”愿景目标的良好契机。目前我国的葡萄酒旅游目的地的发展跟不上旅游需求的步伐,葡萄酒旅游目的地的评价和建设迫
学位
图像描述是计算机视觉应用于视觉理解的一项子任务,其主要目标是将一幅图片翻译为相应文本描述,不仅需要识别图片中的重要对象,对象的属性和位置逻辑关系,还要根据这些信息生成语法和语义正确的句子。与传统视觉任务不同,图像描述涉及计算机视觉与自然语言处理两大研究领域,使其成为一个具有挑战性的工作。现有图像描述方法主要采用“编码器-解码器”结构对图像进行编码、解码从而获得对应描述,效果显著但仍存在诸多问题有待
学位
随着在线社交平台的不断发展,社交网络已经成为信息传播的重要渠道,社交网络中涌现出大量的口碑信息,这些口碑信息不仅影响消费者对企业产品的认知及购买决策,而且对企业制定营销策略有着重要的参考价值。因此,迫切需要对口碑信息传播机制进行研究,如何构建口碑信息传播模型以及真实反映口碑信息传播过程中消费者异质性及社交网络结构成为当前研究的热点与难点。为此,本文通过相关理论分析,首先构建了 De-SHIR 口碑
学位
多模态医学图像是临床诊断的重要参考,由于不同模态的医学图像对各组织突出特征的差异,临床诊断中通常需要综合多种模态的医学图像信息对疾病进行定性评估。为了减小重要模态医学图像的获取成本,跨模态医学图像生成技术至关重要,同时,获取多模态医学图像也是医学图像分割,医学图像跨模态检索等医学人工智能技术的基础。近年来,基于深度学习的医学图像生成方法在各种场景下表现出色,但受限于对多模态医学图像之间的复杂非线性
学位
医学图像报告自动生成技术势必在未来的临床诊断和治疗中普及,它能够大幅度节约医生的工作量,为后续诊断提供更加标准化的依据。随着深度学习研究的深入,模型逐渐趋于复杂导致训练所需数据成倍数增加,尤其在医学领域中数据量小是常态,用大模型训练会产生过拟合现象。同时现有医学公开数据集还存在数据偏差严重的问题(正常样本总是占据数据集的较大比重,而不同症状的异常样本占整个数据集的比重却很小),这使得在利用深度学习
学位