复杂场景下的小目标检测算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xd05724221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,目标检测技术发展迅速,各行各业都可以看到目标检测技术的身影。经过十几年的发展,各式各样的目标检测算法被提出,目标检测的准确率越来越高,但是小目标检测的效果却一直不尽如人意。由于小目标尺寸较小,提取到的特征少,匹配的锚点框少,从而不易被检测。小目标检测需要综合多个尺度特征信息。当前目标检测特征提取采用基础骨干网络结合特征金字塔(feature pyramid networks,FPN)的方式来提取不同尺度特征。FPN在特征融合时只融合了相邻层的特征,非相邻层的特征被稀释,不利于小目标检测。当前感兴趣区域提取主要采用的是手工设置锚点框方式。手工设置的锚点框形状大小单一,不能很好的覆盖小目标,导致锚点框的小目标召回率过低,不利于小目标检测。本文针对现有目标检测框架对于小目标检测的以上缺陷,提出了一种基于密集融合的特征金字塔网络(Dense fused feature pyramid network,Dense FPN)。Dense FPN将各个尺度的特征图直接跳跃连接到特征金字塔,特征金字塔可以直接融合所有尺度特征图信息,减少了信息在网络传递过程中的消耗,增加了特征金字塔每层特征的丰富度。本文提出一种基于可形变卷积的锚点框生成网络结构(Deformable Convolutional Network Based Guided Anchoring,DCN-GA)。DCN-GA通过网络生成各种形状大小的锚点框,不再需要预设锚点框。DCN-GA生成锚点框时使用可形变卷积来解决小目标形状大小不规则的问题。DCN-GA提高了锚点框对于小目标的召回率。本文最后将Dense FPN与DCN-GA融合在同一网络中,在MS COCO数据集和基于虚拟仿真环境下的自动驾驶交通标志数据集上进行实验,然后将实验结果与现有的小目标检测算法对比分析,实验结果证明本文提出的方法有效地提高了小目标检测精度。
其他文献
【摘要】汉语谐音研究多集中于对谐音现象的描写分类、汉外對比,并从语音、词汇、语法、语用、社会文化及民族心理特点等层面进行分析,而从心理认知层面分析谐音生成机制的研究较少。文章从认知语言学的视角对谐音现象进行剖析,探究其生成的内在原动力,并对当下流行的网络社交媒体语言中的谐音现象进行了分类和解释。  【关键词】谐音;激活;转喻;隐喻;生成机制  【基金项目】本成果受北京语言大学院级科研项目资助(中央
创新思维能力是创造型人才的重要标志,对于师范院校教师而言尤其重要。教师应从教师角色情感、教师导向功能的发挥等方面入手,有效的进行创新思维能力的自我提升。
明朝内阁初创时期,阁臣成分复杂,除解缙、三杨等人外,还有一些次级阁臣在不同程度上参与了内阁事宜,王直即是其中之一。王直入阁既没有殿阁大学士的头衔,也没有奉明确的“入阁办事
随着我国经济及科技的快速发展,信息技术也得到了完善和普及,如今我国的各个行业领域都在向着信息化方向发展。当下,医疗行业也正在大力推进信息化建设,且医院的档案管理部门
1临床病例 1.1 一般资料 女性患者,17岁,右眼视力进行性下降3月入院,无头痛、头晕、恶心、呕吐、鼻衄,无癫痫病史,自幼近视,感冒后鼻塞症状重。查体:发育及第二性征正常;矫正视力右眼0
ICSID(International Centre for Settlement of Investment Dispute,以下简称“ICSID”)的设立是投资仲裁在国际法层面建立与发展的开始,其制度设计在国际投资仲裁整体框架
永磁无刷直流电机(PMBLDCM)具有结构简单、调速性能好、效率高等优点。但永磁无刷直流电机的电磁转矩会产生脉动,带来噪声、震动等问题。另外,在某些特殊的情况下,额定转速以
<正>1 Zhaga的使命2010年2月3日由ABL(Acuity Brands Lighting)、库柏照明、欧司朗、松下、飞利浦、施莱德、东芝、TRILUX和奥德堡集团等在内的九家照明行业巨头宣布将发起成
会议
课程资源是我国新一轮基础教育课程改革的一个亮点,。岜改变了教师仅把课程当作教科书或科同的观念,突破了教学就是在教室里上课的传统观念,打破了学生学习活动时间与空间的局限
提出基于网络的用户需求信息跟踪与信息资源建设互馈模型框架,重点讨论数据挖掘服务对信息资源建设高层次决策分析的引导作用和实用性,并对该模型的信息流处理技术和控制流程