基于多尺度特征融合与定位学习的目标检测

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:lin901102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉的基础性研究领域之一,它主要由分类与定位两个任务组成,用于检测输入图像或视频中是否存在感兴趣的目标。目标检测在视频监控、医疗诊断及自动驾驶等领域都有着非常重要的应用价值,因此受到了大量研究人员的关注。近几年随着深度学习的快速发展,深度学习研究方法也逐步与传统的检测算法融合,取得了巨大的突破。然而在实际应用中,目标通常会受到光照、拍摄视角和遮挡等因素的干扰,导致目标的形态和外观发生巨大的变化,进而影响检测器的性能。与此同时,小目标和中目标只占图像信息中的小部分,使用卷神经网络构建特征金字塔时会遗漏很多目标的细节特征。针对上述问题,本文对当前现有算法进行了深入研究,引入了多尺度特征融合、目标定位、一致性监督等方法来提升检测器的检测性能,本文主要创新点如下:(1)针对现有目标检测器存在目标信息丢失,及对多尺度目标特征提取比较粗糙的问题,本文引入了一个特征增强模块,该模块是在原有特征金字塔结构的基础上构建的。首先使用大卷积核对主干网络的特征进行再次提取,以获得更精细的目标特征;然后将提取到的特征进行融合;接着再将融合后的目标特征与原始特征金字塔的特征进行融合,以获得鲁棒的目标特征,同时该操作加强了低层特征与高层特征之间的信息交互。另外,针对分类得分与定位准确度相关性低而造成检测器检测精准下降的问题,本文设计了一个定位评分分支,该分支用于预测预测框的位置评分,并使用分类得分与位置得分的乘积作为预测框的定位得分。本文提出的算法能有效地提升检测器的检测精度,尤其对小目标的预测表现更好。(2)针对目标特征与锚框不对齐,导致提取到的特征容易受到周围其他特征的干扰问题,本文设计了一个特征对齐模块,该模块利用目标的位置信息指导网络更好的学习目标特征。另外,针对特征间存在语义差异问题,本文引入了一致性监督模块,该模块对目标特征进行两次监督学习,以保持特征之间的语义一致性。最后,为了获取到目标的全局信息,本文将高层特征与低层特征进行融合,以获得更具表征力的特征,再使用一个简单的注意力模块提取目标的全局信息。本文算法在复杂场景能够精准的提取到更丰富的目标特征,并能更精准的确定目标的位置及类别,尤其是对小目标的检测。
其他文献
身份认证是网络空间安全的重要核心和基石。传统身份认证方法要求用户提供自己的物品(护照、身份证等)或知识(口令、密码等)。物品容易丢失、被盗、损坏、仿造;知识容易被遗忘和破解。相比之下,生物特征因具有唯一性、安全性、稳定性、便捷性,成为极具发展前景的新兴身份认证方式。然而,随着深度学习的不断发展,图像生成技术日趋成熟,促使某些怀有恶意的攻击者通过图像生成技术伪造真实合法目标用户的生物特征图像,以冒充
学位
2018年,习近平总书记在中央全面深化改革委员会第五次会议上,对县级融媒体中心建设作出重要指示,以此为契机,全国各地的县级融媒体中心建设工作迅速全面地铺开。这一举措成为继上世纪“四级办台”后,自上而下推行的又一项传播领域改革政策。纪录片《最后一次做主播》就是在这样的背景下创作的。吉利区融媒体中心既是该片创作的空间场所,又是创作意义的对象,通过该片对融媒体中心建设发展的困境和解决问题之道进行反思。片
学位
毕业作品《匠心·印记》是一部人物纪录片,以80后手工艺创业者徐默为主要拍摄对象,讲述他坚持从事活版印刷的故事。以主人公为参加北京艺术书展活动所做准备为故事主线,主要采用人物采访和真实生活记录等形式,通过主人公所面对的创业过程中的实际境遇,来展示主人公对活版印刷工艺的热爱,对梦想的追求和对信念的坚持。主人公徐默在雕琢活版印刷产品过程中,不断改善工艺,精益求精,做到了“执事敬”、“事思敬”、“修己以敬
学位
<正>香妃,历史上是否有其人?她的身世如何?她是怎么死的?她死后葬在哪里——是新疆喀什,是北京陶然亭,还是遵化清东陵?世间种种野史、笔记、小说、诗文、戏剧、影视的描述,令人迷惑,无所适从。关于香妃的传说,主要有两个版本。第一个版本是香妃喜剧说。香妃
期刊
全民抗疫对加强个人健康管理和疾病的自我检测提出了新的要求。必须将疾病的准确诊断落到实处。近年来,基于计算机视觉的医学图像分析等技术因其便捷性、隐私性、快速性、自动性等优势,受到越来越多的关注和青睐,并开始应用于个人健康状况的初步诊断。粪便的异常颜色与异常性状通常表明或预示患有肿瘤或消化系统疾病等风险。计算机视觉和模式识别技术在辅助诊断中的使用降低了传统医学图像诊断中医生主观性、认知差异和疲劳诊断过
学位
随着自动化技术和医疗信息技术的不断进步和完善,越来越多的智能化设备进入我们的眼帘,如智慧药房自动化设备在我们的现实生活中很常见。当我们进入一些规模较大的医院时,去药房取药时会发现,有很多的自动化的发药设备将我们的药品运输到药剂师手中,这极大的简短了我们所取药的时间,因此智慧药房自动化设备在当今的社会扮演着举足轻重的作用。本文主要对作者之前参与的一个项目“机械手式智慧药房”进行研究,通过观察其运行时
学位
随着以人工智能为代表的前沿技术嵌入政治领域,人工智能与现代民主政治相结合呈现出一些新特点,如人—机—物高度融合下的“信息矛盾性”牵引公众舆论、大数据驱动下的“高效科学性”影响政府决策、组织结构扁平化下的“资本主导性”分割政治权力等。正是这些特点促成安全风险的生成,使国家政治安全显现出诸多不同于以往的新动向、新表现。伴随人工智能对国家政治安全的影响日益加深,一些典型案例背后映射出相应的影响机理,主要
期刊
在如今社会中,随着互联网科学以及通讯技术的发展与完善,人们之间相互交流更加方便快捷。通讯方式的选择变得更多,构成复杂多变的社交网络,使得信息的传播不在局限于物理空间,信息管理以及与之相关的各种任务也变得越来越重要。但由于复杂网络中的知识传播不同于流行病般的信息传播,因此研究如何构建符合现实知识传播的模型以及如何促进知识传播的策略具有极其重要的意义。本文构建一种新型的知识传播模型,考虑了协作学习和遗
学位
机会网络是一种由大量低成本、短距离无线通信设备构成的自组织网络,通过“存储-携带-转发”的机会通信方式完成消息的传递,具有拓扑时变、网络自组织等特性,在应急通信、智慧交通、环境监测等领域有很大的应用价值。链路预测是机会网络研究中的热点和难点之一,其主要通过已知的机会网络结构等信息预测未来节点之间存在连接的可能性,进而帮助我们理解机会网络的拓扑演化规律,为机会路由协议的设计提供支撑。本文介绍了现有的
学位
自区块链问世以来,它的去中心化等特点引起了诸多研究人员的关注。越来越多的研究学者纷纷涉足这一领域,但是想要对它进行更加深入的研究,就需要从底层开始,剖析区块链的底层架构。截止目前,区块链的改进逐渐成为一个热门的研究方向,但目前国内外相关研究还没有显著的成果。区块链技术最显著的特点为去中心化,它的目的是为了让网络上的节点在不使用中心服务器的基础上相互信任。越来越多的应用采取了这项技术,也因此衍生出不
学位