基于多尺度精炼融合网络的目标检测方法研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:joyden137
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是指对图片中的目标进行定位和分类。目标检测是计算机视觉的核心,在图像识别、大规模场景识别等方面得到了广泛应用。深度学习方法在目标检测领域应用广泛,并取得了远超传统方法的效果。基于深度学习的目标检测方法可分为基于区域建议的方法和无区域建议的方法。区域建议方法在图片上生成大量候选区域,将可能包含物体的区域作为建议区域,之后再对建议区域进行分类,无区域建议的方法则直接回归得到物体的位置和类别。基于区域建议的方法通常具有更高的精度和鲁棒性,因此本文主要研究了基于区域建议的检测方法。区域建议网络是一种常用的区域建议方法,首先通过卷积神经网络实现特征提取,再利用特征信息回归出高质量的建议区域。区域建议网络提升了建议区域的质量并减少了建议区域的数量,因此区域建议网络大幅提升了检测的速度和精度。但区域建议网络只利用了单一尺度的特征图,单一尺度的特征图中包含的信息不足,因此区域建议网络对于较小物体的检测效果较差。本文在总结深度学习中常用的多尺度方法和注意力机制的基础上,对深度神经网络中的特征融合方法进行了深入研究,提出在一种能高效利用多尺度信息的区域建议网络,该方法被称为基于多尺度的区域建议网络(multi-scale region proposal network,MS-RPN)。针对以上问题,本文具体工作如下:(1)本文对多尺度方法进行了研究,提出了基于多尺度方法的特征融合网络。特征融合网络将尺寸不一,分布不同的多个尺度特征整合在一起,改进了单一尺度特征对目标物体的表达能力不足的问题。(2)在特征融合网络的基础上,加入了基于注意力机制的特征精炼网络。特征精炼网络通过计算不同特征之间的相关关系得到关于注意力的概率分布,对不同的特征加以不同的权重,再对加权特征进行降维。解决了特征融合带来的信息冗余并凸显出重要特征,通过提升特征质量进一步提高目标检测效果。(3)为了验证该方法的有效性,本文在两个目标检测权威数据集上进行了对比试验,同时为了验证改进的实用性,在实际应用场景数据集上进行了验证。实验结果表明MS-RPN在各数据集上均能取得较好的表现。结合实际场景对非极大值抑制进行了改进,提出了自适应的非极大值抑制方法(adaptive non-maximum suppression,ANMS),进一步提升了检测器的实用性。
其他文献
有机发光器件(OLED)由于其在平板显示和固态照明领域的潜在应用,在过去二十年里,吸引了学术界和企业界广泛的关注,尤其是在OLED中引入磷光三重态发光材料,在提高电致发光效率方面取得了重大突破,同时也加速了把OLED产品推向市场的速度,为实现大规模OLED的产业化提供了可行性方案。不过目前来说,与较为成熟的绿色磷光OLED器件相比,红色磷光材料由于其发光带隙较窄,激子的淬灭相对比较严重,红光OLE
自2001年我国正式引入美国独立董事制度后,理论界与实务界对其是否能够与我国传统公司治理结构有效衔接的争议一直存在。我国公司治理的实践表明,独立董事制度在维护中小股东权益、提高公司绩效和抑制公司违规等方面有着一定的积极作用,但其所暴露出来的问题也不少,最为突出的就是其独立性问题。在对我国上市证券公司独立董事独立性进行实证分析前,本文探讨了独立董事制度的理论基础、功能价值以及域外不同的立法模式,同时
截止到目前,国内大多数油田开发已经进入到中后期,油田中的采出液含水率往往高达90%,然而,地层中仍有大量低孔隙低渗非均质油藏并未得到有效开采。交联聚合物溶液是一种针对
随着云存储的飞速发展,愈来愈多的数据所有者被激励将其数据进行外包,然而安全与隐私问题始终是阻碍云存储得到普及的主要原因。在云存储中,主要关注的是为终端用户提供安全性,以保护文件或数据不被未经授权的用户访问,以及云本身不能从数据中得到任何私密信息。为了满足上述安全需求,本论文采用代理重加密方案来保护云存储安全。在代理重加密方案中,一个半可信的代理人使用重加密密钥将授权者公钥加密的密文转换成被授权者私
土地是一切生产和生存的源泉,每一个国家的土地制度深深影响着一个国家的发展,每一次土地制度的改革也对社会发展产生极其深远的影响。合理的土地制度,能够稳定社会,促进国家
生产抗菌纺织面料的后整理工艺比较复杂,不仅需要使用毒害化学物质,而且会产生大量漂洗废水。为了发展绿色整理技术,减少有毒物质排放,人们越来越关注低毒性天然抗菌剂。甜菜
随着行政民主化趋势的不断增强,公共行政逐渐从单方治理的模式转变为合作治理,以行政约谈为代表的新型治理手段应运而生,推动了执法方式的创新,并在税收领域、食品安全领域、
翻译是重要的文化传播方式,文学翻译作为翻译的一种文体,在内容表达、艺术魅力等方面具有不同于非文学翻译的显著特征,而且往往还承载着浓厚的文化内涵,所以文学翻译对不同语言间的文化探究及学习至关重要。本次翻译实践的原文选自弗兰西斯·斯科特·菲茨杰拉德的短篇小说《橄榄球场》,翻译字数为1万字左右。本篇报告由两部分组成,即翻译实践报告和翻译实践内容。本篇翻译实践报告以语境理论为指导,重点对翻译实践中所采用的
驾驶员如何识别指路标志并形成路网空间表征是交通心理研究的热点问题。文字排版方式对阅读行为影响的研究发现,无论汉语还是蒙语,文字排版方式都会影响其认知加工。以往关于双语指路标志的研究只停留在横向排版方式下,信息量对驾驶员的影响,未深入理解文字排版方式对驾驶员指路标志识别及道路空间关系认知的影响。内蒙古是蒙古族居住的少数民族地区,指路标志为蒙汉双语并用。蒙语与汉语在文字排版布局及视觉认读理解等方面都存
本文以河南省濮阳县胡状镇敬老院老年人为研究对象,前期运用文献资料法查阅有氧运动对老年人身心健康的影响。通过访谈法,实地调查法了解敬老院老年人的身体健康状况,然后对