基于自适应卷积网络和视觉注意力机制的视频目标检测方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:motombo555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能监控系统、手持拍摄设备在日常生活中的逐渐普及,视频数据呈指数增长,视频目标检测成为计算机视觉领域一个亟待解决的问题。近年来,深度学习技术极大地促进了图像目标检测的发展,各种模型算法层出不穷,奠定了视频目标检测的基础。但是相比图像,视频数据具有帧间相似度高,相邻帧存在时序关联性,数据量大等特点,且数据中存在由物体和镜头相对运动引起的尺度变化、外观变化、物体遮挡和运动模糊等挑战。现有的主流算法,要么利用视频帧间的相关性进行特征融合提高模型的精度,要么利用视频帧间的相关性进行特征传递提高模型的速度。针对上述问题,本文权衡视频目标检测的精度和速度,从特征提取、特征融合、损失函数和关键帧选择等方面展开深入研究,并通过实验验证分析提出方法的有效性。具体的研究工作主要包括如下:1.针对视频中小目标偏多的问题,本文提出并实现了一种基于多尺度特征交叉融合模块和IOU(交并比)损失的网络结构。使用多尺度特征交叉融合模块将浅层特征的细节信息和深层特征的语义信息进行多尺度融合,提高网络对密集小目标的召回率;使用与面积有关的IOU损失将候选框坐标作为一个整体进行回归,克服了网络同等对待相同位移偏差对大、小型目标造成不同影响的问题,并通过中心距离、面积等因子加速模型在候选框和标定框完全重合和完全不重合时的收敛速度。实验表明:本方法有效地提高了目标检测的精度,尤其小目标的识别率。2.针对视频中普遍存在的外观变化、尺度变化、旋转等情况,本文提出并实现了一种基于多尺度自适应卷积和通道注意力的网络结构。多尺度自适应卷积模块使用标准卷积提取图像特征,可变形卷积学习物体的位置变化,空洞卷积扩大感受野的同时保留更多的细节信息,使模型具备对物体几何变换的学习能力。并使用通道注意力对模块不同分支的卷积结果进行自适应加权融合。实验表明:本方法极大地提高了模型对发生非刚性形变物体的检测准确率。3.针对视频中存在的运动模糊和物体遮挡情况,本文提出了一种自适应关键帧选择策略。可以根据视频帧间SIFT(尺度不变特征转换)特征的相似性动态地确定关键帧,实现相似度低时的密集采样,由基础卷积网络提取关键帧的特征;相似度高时的稀疏采样,利用光流信息提供的帧间空间位置相关性将之前关键帧的特征进行变形(warp)后传递给非关键帧。并在检测结果中沿着时间轴构建相邻帧候选框总得分最高的序列,对序列中的候选框进行重打分,并去除同帧中与序列中候选框交并比较高的其他候选框。相比以固定间隔选取关键帧的Deep Feature Flow、Impress Network等算法,不仅解决了运动模糊和物体遮挡对检测结果的影响,而且更好地实现了检测速度和检测精度之间的平衡。
其他文献
对于渎职类犯罪危害结果中的非物质性损失结果,我国当前刑法和司法解释并未对其作出一个具体的概括和界定,学术界研究成果也相对偏少,导致了司法实践中对于非物质性损害结果
本研究以湖南省会同县的杉木(Cunninghamia lanceolata)纯林和3种杉木-阔叶树混交林,即杉木-樟树(Cinnamomum camphora)混交林、杉木-栲树(Castanopsis fargesii)混交林、杉木-桤木
本文依托我国能源通道“蒙西-华中”铁路中的隧道建设项目,该项目在陕西地区遇大面积黄土隧道建设,而黄土最重要的特性就是湿陷性。一方面,黄土隧道开挖施工过程中遇地下水,隧道洞口边坡遇强降雨,均会使原本具有较高强度的黄土发生湿陷变形,强度不断降低,严重影响黄土隧道施工安全。另一方面,该项目所在的我国西北黄土地区,一年中温度变化明显,夏季地表温度最高可升至50℃以上,而冬季则会降至零度以下,即使是在一天之
当前,随着我国现代化建设步伐加快,有大量不良地质区域亟待加固与改造以满足工程施工要求。土工合成材料凭借其成本相对较低,运输方便及用途广等优点受到越来越多的重视。土工袋是众多土工合成材料的一种,一般是将土体装入编织袋形成土袋加筋体,并用于构筑临时构筑物,近年来,有学者发现土工袋能起到加筋、减振、防冻胀等多种作用,因此,本文主要针对其在加固地基方面的相关应用进行了研究,另外还设计了一种新型内拉筋土工袋
随着经济全球化的发展,世界各国之间的商事交往日渐频繁,随之而来的商事纠纷也越来越多,由于此类纠纷的国际性,如果由法院来处理的话,在管辖法院,冲突规则的选择,准据法的确定等方面会面临冲突和选择,需要花费的时间和经济成本较高,因此出于成本以及时间的考虑纠纷当事人经常会选择以仲裁的方式来解决问题。临时措施制度在仲裁中的临时性救济和保全作用越来越重要,是因为国际商事仲裁案件中,事实的复杂性、当事人的跨国性
本文提出了一种基于动态循环网络的目标检测器,该方法简化了深度神经网络中重复性模块。不同于普通神经网络中的序列化前向传播机制,本毕设提出的动态循环网络循环使用网络模块,并且用较少的模块数量达到了更好的效果。此外,本毕设提出在每个循环模块上添加门单元来动态决定循环次数,该方法有效减少了时间开销。因为循环网络是难以训练的,本毕设提出循环可变批次归一化来稳定易变化的梯度。更进一步,根据门单元的输出,本毕设
杜仲(Eucommia ulmoides Oliv.)是我国特有的第三纪孑遗植物,兼具极高的药用价值和经济价值,其主要药用部位是树皮,常用环剥的方式采收。剥皮后,杜仲极易因木质部大范围暴露在空气中而导致水分蒸发,易造成水/盐胁迫。在杜仲新皮再生过程中,常用激素处理以促进愈伤组织形成和维管束形成层再生。Ca2+-钙感受器信号通路与激素信号途径密切相关,已有研究表明钙感受器可以通过激素途径发挥作用,同
近年来,网络通信技术取得了快速的发展,与此同时人们对于信息传输的需求急剧增长。仅仅依靠于地面通信网络,受限于各种极端地形以及自然灾害等多种因素,根本无法满足人们对于通信的高要求。而卫星网络是一个由高空网络、空间以及地面构成的综合通信系统,可以实现地球表面的全覆盖,可以提供高带宽并且同时可以保证数据的传输速率,且近乎不受地理因素以及各种自然灾害的影响。这些特征使得卫星网络成为了通信网络发展的主要趋势
人口老龄化是全球各国面临的重要社会问题之一。为应对人口老龄化大潮,世界卫生组织(WHO)先后提出了“健康老龄化”、“积极老龄化”口号,号召各国积极应对人口老龄化带来的挑战。近二十年间,我国的老龄化持续加重,老年人口年平均增长率高达3.28%。面对庞大的老龄人口及其迅猛发展趋势,习近平在十九大报告中提出健康中国战略,要求发挥政府的主导作用,积极促进老年人健康,由此拉开了中国积极应对人口老龄化挑战的序
红色文化为我们的社会建设不断输送着源源不断的动力支撑,其中红色基因更是深深地鼓舞了一代代中华儿女奋勇向前。习近平同志曾多次提出我们要弘扬红色文化,各地区要充分合理利用好自己地区的红色文化,将红色基因深深镌刻在青年人身上。榆林不仅是陕北的革命老区,也是全国著名的革命地区。早在1924年11月,陕北第一个党团小组就在榆林建立,中国共产党组织在榆林的成立,说明了新民主主义革命这一时期,榆林已经诞生了自己