基于级联结构改进的多感受野分支网络目标检测算法研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:t920215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域重要的研究方向和研究热点,现已广泛应用于无人驾驶、机器人、视频监控、行人检测、海面舰船检测等领域,其任务是从复杂场景中将目标物体进行分类和坐标定位。当前的主流算法是基于深度学习的目标检测算法,但大都存在对小目标检测效果差的问题。针对这个问题,现有的改进算法大都使用特征融合的方式,达到增强算法对小目标的检测效果,但这种方式增加了很多网络参数,导致检测速度变得很慢。为此,本文提出了一种基于级联结构改进的多感受野分支网络目标检测算法,提高了整体的检测效果,尤其提高了小目标检测效果,同时拥有较高的检测速度,主要工作及贡献如下:(1)本文提出多感受野分支网络。从感受野角度出发,引入空洞卷积,提升了整体检测精度。该网络在训练阶段提出改进的分类损失函数Enhanced Focal Loss代替原始交叉熵损失函数,使网络训练更明显的偏向于难分类样本,提升了训练效果。(2)本文基于级联结构设计强化检测模块与原网络级联。针对小目标检测设计加入STFCN(小目标特征组合网络)的小目标强化检测模块,使得算法对小目标检测效果有所提高。针对大目标检测设计融入AF(预选框筛选)的大目标检测模块,提升了大目标的检测效果。本文在PASCAL VOC 2007数据集上,将本文的改进算法同当前目标检测几个主流算法进行对比,表明了本文算法的有效性。
其他文献
随着互联网的普及和网络舆论影响力的不断彰显,日益增长的网民群体成为社会关注的焦点。网民作为网络舆论中最重要的主体,不断创造影响力巨大的网络舆论。目前,网民发表的评
结构动力学特性测试和模态分析技术对结构安全性、设计优化和损伤探测有着重要的意义。在对桥梁、建筑、风力发电及其和电力塔架、火箭等大型结构进行动力学特性测试时,如果
基于运动想象(Motor imagery,MI)脑电(Electroencephalograph,EEG)的脑机接口(Brain-computer interaction,BCI)可以用于代替原有的或重建丧失的中枢神经系统输出。神经反馈
传统聚类算法无法有效处理高维数据并且具有较高的计算复杂度,基于这两个问题提出了子空间聚类算法,但是子空间聚类算法在处理非线性数据上效果具有限制,尽管已经引入了内核
频率选择表面本质是一种空间滤波器,与照射到其表面的电磁波会发生相互作用,使这些电磁波有选择性的通过这个平面,在一定频段内,会呈现全反射或全透射的现象,在通信领域应用
多视点视频是指在场景中放置多台摄像机,记录下多个视点数据,提供给用户视点选择和场景漫游的交互式媒体应用。与传统的单视点二维视频相比较,多视点视频与人们的视觉需求更
杂环化合物在整个化学领域有着不可替代的地位,其数目已经占据已知有机化合物的一半以上。尤其是在天然产物中,由于其良好的生物活性,杂环化合物已经成为农药、医药等领域的
大规模多输入多输出(Massive Multiple Input Multiple Output,Massive MIMO)技术作为第五代(5th Generation,5G)移动通信系统关键技术之一,极大提高系统容量、保障系统可靠性,
目标跟踪目前在无人驾驶、视频监控、人机交互等领域应用十分广泛。由于目标检测领域已经相对成熟,国内外专家学者把更多注意力放在了目标跟踪领域,在这个领域里,目标跟踪首
本研究对抚仙湖FXH-6岩芯钻孔进行元素地球化学和正构烷烃指标分析,重建了中晚全新世以来抚仙湖流域的环境演变及人类活动影响。将抚仙湖沉积记录与季风区湖泊沉积记录进行对