基于神经网络的视频目标检测算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:simon20088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉技术以及人工智能的发展,近几年图像的目标检测取得了巨大进展,得到了工业界和学术界的广泛关注。图像的目标检测需要检测并且识别出指定目标的物体,也是视频目标检测主要技术之一。随着智能视频处理技术的发展,对视频序列进行目标检测逐渐进入人们的视野中,并且在实际的监控领域中成为其它技术的基础。如何有效的提高视频序列中目标检测的性能具有非常重要的研究价值。针对这一问题,本文从目标检测中图像分类的准确性和视频序列中帧间的相关性两个方面,研究视频序列中目标检测关键技术及其应用。本文主要包含以下两方面的研究内容:
  (1)图像分类是图像目标检测的核心任务之一,本文提出了一种基于多特征聚合网络的图像分类算法。利用拓扑网络结构提取特征信息,然后,对提取的特征信息进行聚合分析,在不增加网络深度的情况下提高分类性能。其中,聚合分析是基于反馈调整学习率提出的一种拓扑网络框架,网络由多个拓扑节点组成,每个节点由基本的网络结构组成。在训练过程中,为节点分配不同的学习速率,在每个新训练时段的开始进行调整,首先基于训练准确度的反馈从当前学习率集合中选择最优学习率种子。然后由学习率种子生成新的学习率集合并用于训练拓扑网络。
  (2)为提高视频序列检测精度,本文利用视频序列帧间相关性,估计运动目标的运动向量,提出了一种基于光流特征融合的视频目标检测方法。首先将视频帧进行分组计算光流特征,使得组内所有视频帧共享相同光流特征图;然后,利用每组中共享的光流特征与组内原始视频帧分别运算,使得所有帧中运动的目标所在处呈现高响应;最后将含有高响应区域的视频序列通过检测网络。实验结果表明该方法不仅仅提高视频序列检测的准确率,而且在一定程度上提高了目标检测网络的场景迁移性能。
  本文提出了基于神经网络的多特征融合视频目标检测算法。该算法从目标图像分类和视频帧间信息两方面改进,有效的提高了视频目标检测性能,并且在实际中有一定的应用价值。
其他文献
剩余电流监测在各类用、配电系统是必不可少的一项安全措施,近些年来,随着开关器件的创新与发展,产生的剩余电流波形变得越来越复杂,并逐渐向高频化发展,给剩余电流检测技术带来了更大的挑战。  传统的AC型剩余电流保护器只能对低频交流进行检测,而A型保护器能对低频交流及脉动直流进行检测,面对剩余电流高频化的趋势,两者已经不能满足电力系统保护要求,B型保护器应运而生。在非接触式微弱电流检测中,磁通门技术由于
本文设计并制作了一款用带状纳米材料修饰的基于微波带阻滤波器的超高速、高灵敏度湿度传感器。应用所设计的交指电容,在2GHz到12GHz的频段内确定了两个水蒸汽敏感检测频率。优化后的双频段微带带阻滤波器获得了更高的响应和更好的品质因数,提高了湿度传感器灵敏度。为了研究微波湿度传感器的性能,将修饰了氧化钼敏感材料的传感元件置于湿度测试腔中,在室温环境下实现了对五个湿度等级的测试。测量结果表明,插入损耗从
随着激光技术的飞速发展,激光测距技术已被广泛应用于各个领域,激光测距技术具有大量程、高精度等特点,是高精度距离测量中最重要的技术之一。本文主要研究两种激光测距技术:基于单光子探测的激光测距技术和基于线性调频连续波的激光测距技术;第一种适用于远程激光测距和探测微弱回波信号,第二种适用于高精度、无合作目标配合的大型空间精密测量;两种激光测距技术对于航空航天以及大型制造领域具有重要意义。  本文基于以上
学位
3D视频通过增加视点数目、深度数据等方式提供立体深度感知。作为3D视频的重要组成部分,深度视频反映了场景中物体的远近和分布状况。与传统的平面彩色视频相比,深度视频具有显著的差异,因此需要研究更为高效的深度视频压缩编码方法。近年来,以卷积神经网络为代表的深度学习技术快速发展,在视频处理和计算机视觉理领域取得了丰硕的成果,为进一步提高深度视频编码性能提供了新的思路。本文以卷积神经网络技术为基础,基于深
雨是最常见的气候现象,在雨天环境下,视觉传感器拍摄到的图像和视频会严重退化,出现模糊、细节丢失、颜色失真等现象。这些现象在影响视觉效果的同时,也会导致视觉处理算法如图像分类、目标检测、图像分割等性能的下降。因此,研究图像去雨对提升室外计算机视觉系统的稳定性有重要的意义。单幅图像去雨方法缺少图像序列之间的时间信息,相对于视频去雨具有更大的挑战性。本文围绕单幅图像去雨任务展开工作,主要工作内容和研究成
目标跟踪是指在第一帧中利用矩形框手工标注跟踪目标,计算机通过特有算法框架,精确定位出后续视频帧中目标位置。近年来随着计算机硬件及图像处理能力的提高,目标跟踪吸引了越来越多的关注。由于卷积神经网络在特征提取中的强大能力,目标跟踪领域的前沿研究主要基于深度学习和神经网络。现有的方法存在以下两个问题:1)目前目标跟踪任务中,由于训练数据集中困难样本缺少且覆盖的情况太少,导致基于“数据驱动”的深度学习网络
学位
协同显著性检测是指从一组图像中检测出共有的、显著的前景目标,在场景分割和目标跟踪等领域起着重要的作用。如何计算图像内和图像间显著值是算法中最关键的步骤,然而现有很多算法没有探索更多的表征图像内和图像间关系的特征信息,故当图像组背景环境复杂、前景目标混乱不易区分时,无法准确地检测出前景目标。  为了探索更有效的特征信息、弥补颜色特征的局限性,本文提出了一种基于对象性和多层线性模型的协同显著性检测算法
随着多媒体技术和互联网的发展,图像逐渐成为一种简单高效的信息承载方式,在人们的日常生活中发挥着至关重要的作用。然而,图像在获取、处理、传输和存储的各个阶段都有可能产生质量退化效应,不仅影响用户的视觉体验,而且不利于后续的应用。因此,通过分析和建模提出有效的图像质量评价方法具有重要意义。图像信号通过人眼接收并传递给视觉皮层,人眼视觉系统决定了图像以何种形式被解释和理解,从而产生美观与糟糕等主观判断。
基于草图的跨域图像检索旨在根据输入的手绘草图与数据库中彩色图像的相似性度量返回彩色图像排序结果。该检索可以在基于文本的图像检索不准确或基于内容的图像检索中彩色图像难以获得的情况下,通过输入手绘草图完成图像检索任务。虽然相对于传统的图像检索算法,现有的草图检索算法效果得到了较好的提升。但是草图与彩色图像的特征映射与跨域检索等问题仍然没有得到较好的解决。因此,本文从网络结构与多损失函数优化两个方面,提
学位
近年来,隐身技术发展迅猛,在战争环境中占有不可替代的位置,因此反隐身技术的研究更是迫在眉睫。认知雷达不只具备对环境相应变化的感知能力,而且更具备处理自适应、能力自提高的优势,将认知雷达应用于反隐身技术中,让其根据对环境的感知进行自我调整从而能够极大的提升反隐身能力。本文将研究认知雷达识别隐身目标的方法,建立认知雷达认知-反馈-决策-响应的闭环体系,提出一种认知雷达跟踪识别隐身目标的框架,将分布式卡
学位