论文部分内容阅读
近年来,随着人们对安防领域的日益关注以及计算机视觉技术的不断发展,通过摄像机获取的监控视频以其直观且具体的信息表达形式得到了广泛的认可,大量的摄像头安放在了我们生活中的各个角落。视频监控数据的爆炸式增长,为后续的存储、检索带来了巨大的挑战。视频浓缩技术作为解决上述问题的有效方法,已成为安防领域的热点问题。本文从视频浓缩系统的四个主要部分,分别为运动目标的检测、运动目标的跟踪、轨迹的组合优化以及轨迹与背景融合生成浓缩视频,进行具体分析及优化。首先,将深度学习的方法引入运动目标的检测与跟踪环节。采用融合YOLOv3目标检测器的Deepsort算法实现对视频中目标的跟踪,改善了传统算法中检测精度低,跟踪效果差的问题。其次,为了解决复杂场景中ID的频繁切换问题,提出一种对发生ID切换的轨迹进行重识别的策略,并对该策略做出定性分析,设计跟踪系统进行验证,提出了轨迹重识别算法。之后,利用所提取的跟踪结果,通过对目标之间的遮挡、时序、以及运动关系进行分析对比,设定目标函数,将求取最优轨迹组合的问题转换为求得目标函数最小值的问题,从而提升轨迹组合优化的效果。最后,依据轨迹组合优化算法所求得轨迹的最佳位置,将所提取出的轨迹与背景一一融合生成浓缩视频。为了提高融合效果,消除轨迹与背景之间拼接的不自然现象,采用泊松融合的方式,生成画面流畅自然的浓缩视频。通过行人跟踪数据集与实验室摄像头的视频数据,对视频浓缩系统中各个部分进行实验测试。实验证明本文研发的视频浓缩系统可以有效地去除原始视频中的时空冗余。对于场景较为复杂的视频,浓缩比为65%左右,而对于场景简单,人员稀疏的视频,浓缩比可降低至4.1%,大大缩短了视频时长。且与原始视频比较,所生成的浓缩视频完整的保留了目标之间的运动信息,画面流畅自然真实度高,尤其对于复杂场景下的监控视频,有效地减少了浓缩视频中同一目标多次出现的问题,提高了视频的可浏览性。因此,本文所提出的视频浓缩系统具有良好的工程应用价值。