基于深度特征流学习和选择注意力机制的视频目标检测

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:sheena111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的日益发展,人们对视频目标检测领域的关注也逐渐提升,虽然视频目标检测算法成为了如今研究的热点并取得了一定的突破,但是还存在检测准确率低、对模糊目标的检测效果不理想以及对遮挡目标定位不准确等问题。本论文将选择注意力机制、自适应视频关键帧提取方法和距离交并比回归损失函数应用到视频目标检测任务中以提高检测的准确率。论文的主要工作内容和创新点如下:1.针对视频目标检测中对特征图各通道投入的关注程度相同,导致目标物体的检测准确率不高的问题,本文基于深度特征流视频目标检测算法,对其中的特征提取网络残差网络进行改进,提出了RECA-Net视频目标检测网络模型。通过通道注意力机制模块,实现了特征图中局部跨通道的信息交互,增强特征图中目标特征通道的显著性,从而使得模型在训练过程中能够捕捉到视频帧中的重要信息,进而提高模型检测的准确率。通过在公开的ILSVRC 2017 VID数据集上的实验证明,RECA-Net的检测准确率比DFF、FGFA、TPN视频目标检测算法高。2.针对视频帧图像中存在目标物体不清晰以及运动幅度较大,导致视频关键帧选取不合理的问题,本文提出了一种自适应视频关键帧选取方法。首先通过拉普拉斯梯度函数计算当前视频帧图像的清晰度,然后利用光流网络计算当前视频帧与其最邻近视频关键帧之间所有像素位置的总位移量来判断目标物体是否发生剧烈运动,只有当前视频帧足够清晰且目标目标发生剧烈运动时,此视频帧才可以作为新的视频关键帧。这种视频关键帧选取方法在保障了视频关键帧质量的同时,在一定程度上提高了视频中目标检测的准确率。通过在ILSVRC 2017 VID数据集上的实验证明,基于自适应视频关键帧提取的视频目标检测算法取得了比DFF、FPFA、TPN、RECA-Net算法更高的检准确率。3.针对在网络模型训练过程中边界框回归不够稳定,导致网络模型发散的问题,本文改进了视频目标检测网络模型中的回归损失函数。利用距离交并比损失函数作为边界框回归部分的损失函数,改进后的网络模型回归损失函数考虑到了边界框与真实标注框之间的重叠面积、中心点距离以及重叠率等方面,从而使得边界框的回归更加稳定且有效,进而提高了视频目标检测算法的准确率。通过在ILSVRC 2017 VID数据集上的实验证明,利用距离交并比回归损失函数进行模型的训练,可以提高了模型的检测能力以及泛化能力。相比于DFF、FGFA、TPN、RECA-Net和基于自适应视频关键帧提取的视频目标检测算法,基于距离交并比回归损失函数的视频目标检测算法取得了更高的检测准确率。
其他文献
随着人工智能技术的蓬勃发展,即时定位与建图(Simultaneous Localization and Mapping,SLAM)已然成为了智能自主机器人当中的关键技术,同时在自动驾驶以及增强现实等方面也有广泛应用。静态环境是大多数视觉SLAM的前提条件,一定程度上限制了它的实际应用。当移动物体进入相机视野中,传统SLAM将无法进行准确地跟踪定位,同时移动物体在环境中的随机运动也会污染重建的全局点
随着时代的进步和社会的发展,传感领域发展迅速,其在生物医学、城市建筑、环境监测、通信技术、机械控制等领域均有应用。其中干涉型光纤传感器由于具有结构简单、传输损耗较低、成本低廉、尺寸较小、抗腐蚀等优点,可以用于测量温度、应变、折射率(refractive index,RI)、湿度、曲率等环境参数。本文研究所用的基本理论是光传输特性和各个模式之间的干涉原理,分别设计出温度和RI双参量同时测量的干涉型光
从生物信息学形成早期到人类基因组计划的实施,人类对生命起源的探究逐步迈入后基因组和蛋白质组时代,这一步步的进程都伴随着序列比对研究,序列比对研究亦是生物信息学、计
随着我国经济水平显著提升,社会压力也随之增加,人们越来越重视知识和教育,农村落后的教育水平无法满足农村家庭希望孩子得到良好教育的需求,这样的现状之下陪读现象应运而生。由于家庭结构的转变、社会老龄化以及女性职业化的发展,从最初的母亲陪读到现在越来越多祖辈家长成为陪读的主力军,隔代陪读已经成为农村陪读的一种主要形式。农村隔代家长在面对生活环境变化、角色转化、旧支持网络断裂的情况下,可能会面临来自多方面
近十年来,志愿服务事业如雨后春笋般蓬勃发展,随着志愿服务事业的推动和互联网的进步,志愿活动中产生了海量志愿服务数据。如何处理和利用志愿服务数据,对志愿用户的行为进行指导,为志愿事业的参与者提供有价值的参考,成为亟待解决的问题。随着人工智能及互联网大数据的发展,“互联网+”志愿服务信息一体化工作也逐渐开展。对海量的志愿服务数据进行分析与研究,构建志愿服务领域的知识图谱,一方面以图谱的形式将复杂的结构
铁路企业混改基金是铁路总公司为推进铁路行业混合所有制改革提出的设想。铁路企业混改基金成立的必要条件就是不同利益主体之间能够达成良性合作。以铁路部门为代表的国有资本具有安全性要求,社会资本具有高收益要求,因此,在基金募资过程中需满足不同风险偏好投资主体的需求。本文使用演化博弈理论对铁路企业混改基金股东之间的博弈进行理论分析,同时结合系统动力学仿真方法,对博弈过程进行仿真模拟,来研究以铁路部门为代表的
塑料具有价格低廉,使用方便和功能多样化等特点,已经被广泛应用于我们的日常生活中,给人类的生活带来了极大的便利。近几十年来,人们对于塑料的需求越来越大,从而刺激了塑料产业的极大发展,造成全球每年生产的塑料总量越来越多。然而,由于塑料的难降解性,造成大量的塑料垃圾长期滞留在环境中,从而引发一系列严峻的环境问题并且对经济发展极为不利的。因此,如何有效的处理废塑料污染问题是全世界范围内亟待解决的难题,基于
近年来,随着大数据技术和计算性能提升,深度学习技术已经在图片分类、自动驾驶、面部识别及恶意软件检测等领域获得突破性发展。但最新研究表明,在样本数据中加入不易察觉的扰动就会导致深度学习模型以极高的置信度输出错误的预测结果,这严重危害了深度学习模型应用的安全性。目前对于对抗样本的研究主要集中在白盒攻击和单一扰动情境下,而黑盒攻击下的通用扰动具有攻击者所需知识少、攻击部署快等特点,是更符合现实场景的攻击
信息技术的迅猛发展和大数据时代的到来,带来的是数据的井喷式增长,人们难以从海量的信息当中快速提取自己所需要的有价值信息,即导致“信息过载”现象的出现。推荐系统的出现有效地解决了这一问题,协同过滤推荐算法是目前应用较为广泛的推荐算法之一。但是传统的协同过滤算法忽视了用户偏好的时间可变性对推荐结果的影响,且面临着推荐准确率低和对数据稀疏性敏感的问题。本文针对关于时间的推荐算法中准确性问题和数据稀疏性问
随着世界经济竞争的加剧,我国劳动力市场的外部环境也逐渐地向动态化方向变化,特别是在2020年初的疫情对世界经济的冲击下,促使研究者更为深入地探讨组织与员工之间在面临重大外部环境变化时如何寻求双方的合作互利共赢。雇佣模式对员工的影响研究一直是组织心理与组织行为学研究的热点,以往的研究多关注于雇佣模式对员工的直接影响上面,虽然取得了丰富的理论成果,但仍然存在一些亟待完善的地方,特别是关于雇佣模式对员工