视频监控中行人检测和跟踪技术的研究

来源 :沈阳理工大学 | 被引量 : 0次 | 上传用户:ytli1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国家城市化的不断扩大,大量人员涌入城市,造成了人口流动的加剧,老百姓对于个人及社会的安全问题提出了更高的要求。智能视频监控系统的应用受到了大家广泛的关注,行人检测与跟踪技术是其核心。本文的研究思路为通过运动目标检测算法将视频监控中的运动区域从背景中分离出来,之后通过行人检测方法,将运动区域的中行人对象检测出来,最后将行人目标信息传递给跟踪算法,对行人进行跟踪。论文的具体内容可总结如下:(1)运动目标检测。主要对帧间差分法、自适应混合高斯背景建模方法、ViBe算法进行了对比实验,从运动区域提取的形态学完整性及检测时间上,ViBe算法取得了比较好地平衡。针对ViBe算法中存在的鬼影问题,本文利用帧差法与ViBe算法检测原理的不同,将三帧差得到的图像经孔洞填充算法与形态学处理后,与ViBe方法结合,来加速鬼影的消除。实验结果表明,将改进后的三帧差法与ViBe结合的方式可以更快消除因为鬼影带来的误检测问题,检测结果更加准确。(2)行人检测。将运动区域提取出来后,需要对运动区域中的行人对象进行识别与检测。这部分主要介绍了基于机器学习SVM与基于深度学习YOLO3-tiny网络的两种不同原理的检测方法,并着重对基于深度学习YOLO3-tiny网络模型进行了研究,本文以YOLO3-tiny网络模型为框架,通过修改网络模型的分类器的输出维度,并在行人数据集上训练与验证,实现基于YOLO3-tiny模型的行人检测。实验结果表明,本文实现的基于YOLO3-tiny模型的行人检测效果优于SVM的方法,同时该方法在检测的准确率及检测速度上都可以满足实际场景下行人检测的要求。(3)行人跟踪。将行人检测出来后,需要对行人进行有效的的跟踪。这一部分主要对生成式的跟踪方法中的Meanshift算法与Camshift算法进行了介绍,针对行人目标在移动过程中出现的短遮挡及周围有相似颜色行人干扰的情况,本文采用Kalman与Camshift相结合的方式,来提升原Camshift算法跟踪的稳定性。最后将跟踪算法与之前的检测方法结合,实现在简单场景对下多个行人的自动检测及跟踪。
其他文献
人体行为识别作为计算机视觉和模式识别的热门研究方向,已经在人机交互、智能视频监控、运动分析和医疗辅助等诸多领域得到广泛地应用。人体行为识别是指从视频图像识别人体行为动作同时完成对人体目标的定位跟踪。近年来,大数据技术的发展推动了人体行为识别研究的进步。如何在采集少样本数据集的前提下,迅速获取视频图像中人体行为的信息,使视频数据成为可直接利用的信息资源,仍是需要我们研究的课题。本文在采集少量人体行为
基于机器视觉的公路汽车流量检测技术研究是在不需要人为干预的情况下,从获取初始视频帧开始,移动对象从背景中分割的方法对摄像机拍录的图像序列进行分析,然后到整个视频的汽车计数,实现对场景中汽车的计数,基本得到汽车多少及道路拥堵情况。在视频监控系统的终端实现运动目标检测和计数功能。而本论文主要对两种检测方法进行了理论研究,分别是:(1)帧差法及高斯混合模型法:帧差法是处理视频数据时,从视频中选择代表帧并
超声诊断具有无损、价廉、非电离辐射性、实时等优点,使其成为现代临床医学必不可少的影像诊断技术之一。由于超声成像的相干特性产生的大量噪声,使超声图像存在信噪比低、成像质量差等问题,尤其是掩盖和降低了图像某些细节信息,给之后的图像特征提取和识别,病情诊断及定量分析造成不利的影响。因此,抑制这些噪声,增强图像的细节,改善图像质量是超声图像分析和识别的重要预处理环节,也成为近年来备受研究人员关注的热点问题
虚拟现实技术在科技快速发展的今天,其身影频频出现在各大领域之中,其便利性与高反馈性在科学研究中有着很高的应用价值。将扑翼式飞行器与虚拟现实技术进行结合,使扑翼式飞行器在虚拟世界中进行虚拟仿真和功能实验,是机械领域与当今新兴技术的交叉融合,具有很大的研究意义与应用前景。本文在世界主流开发引擎中进行分析与研究,选择使用Unity3D引擎作为平台并开展了扑翼式飞行器的虚拟仿真与功能算法研究,主要完成的工
随着信息融合技术的发展,传感器的协同工作应用愈发广泛,红外与可见光图像的融合也是多传感器技术的一部分。图像融合技术就是将来自不同传感器的两张或两张以上的图像进行融合,增加图像信息中的完整度,从而让观察者得到更多的视觉信息。图像融合在医学图像、军用场景、遥感图像和机器视觉等方面得到了广泛地应用。本文将深度学习应用在红外和可见光图像融合汇总,提出了三种红外与可见光图像融合方法。首先,研究了基于深度学习
在边防区域的野外环境下,通过对入侵目标声音信号的分析处理,完成入侵目标的探测识别,以实现边防区域的智能化实时监控。传统的目标探测识别方法是使用多传感器进行组合探测,其中,声音传感器易受噪声和其它声源的干扰,导致声目标识别的准确率下降。针对上述问题,本文设计了一个野外环境下的人车识别方案,并对其中的端点检测算法进行优化改进。本文主要围绕基于声音传感器的声目标识别技术进行重点研究,并从以下四部分展开讨
随着经济社会及硬件性能的发展,视频分析任务越来越受到重视。同时,人体行为识别技术已广泛应用于虚拟现实,视频监控,视频检索等领域。在深度学习和图像分类任务取得成功的大背景下,基于深度学习的双流网络以及可以同时提取时空特征的3D卷积应运而生。近年来许多人体行为识别技术方法如C3D(3D Conv Net)、I3D(Inflated 3D Conv Net)、S3D(Separable 3D Conv
目前的模拟训练系统是通过小尺度环境来模仿大尺度现场。当模拟训练系统定位载具时数据采集困难,定位精度不准确等问题上还没有完善的解决办法,所以本文将以以上问题入手,重点研究以UWB定位技术为基础的模拟训练系统及对TDOA准确测量的研究,本文基于UWB室内定位技术设计实现模拟训练载具多基站定位系统,从UWB定位技术自身所拥有优势入手,分析UWB定位技术中常用的几种测距算法,分析误差来源。最终实验结果表明
随着军用无人机的发展,战场上出现多无人机系统协同作战的情况日益增多,无人机自组织网络(UAV Ad Hoc Network,UANET)具有容灾能力强、增大通信范围和可靠性高的特点,因此,UANET作为多无人机系统主要使用的无线网络。UANET通常采用分簇算法对网络进行分簇,但是UANET节点的高移动性会降低簇的稳定性,进而降低网络性能。传统的主动式和被动式路由协议应用在分簇结构的UANET中网络
智能视频监控中对于维护社会公共安全的秩序发挥着重要的作用,在视频中如何对行人异常行为进行检测是计算机视觉领域的重要研究方向。虽然在行人异常行为检测中已经有很多研究学者取得了一定的研究成果,但是由于在复杂环境变化下行人行为的运动特征信息提取较难,导致研究行人行为异常检测进展缓慢。基于此,本文针对ViBe算法在高动态背景变化下产生闪烁像素点、阴影、鬼影对行人运动目标提取不准确的问题,采用一种基于原Vi