论文部分内容阅读
随着高清摄像设备的普及和物联网的兴起以及平安城市和智慧城市的提出,监控摄像头被广泛地部署在城市的每一个角落。监控设备可以在打击违法犯罪,维护社会长治久安上发挥重要的作用。然而海量的视频数据也在视频的存储归档和查阅检索上给人们带来巨大的考验。传统的直接存储和人工检索方式已经无法应对大规模视频的处理需求。如何解决海量视频的存储和检索的难题已经成为国内外学者研究的热点。因此本文针对这两个难题展开了相关研究。在查阅了大量国内外文献和资料之后,对视频存储和检索领域有了一定的了解,深入分析了课题的研究现状。阐述了当前研究工作的主要难点在于如何将监控视频中前景对象准确且无遗漏地检测出来;在检测出前景后如何对其进行多概念检测;在对多概念对象进行分类和描述时如何跨越语义鸿沟等。在此基础上本文提出了基于背景检测和属性学习的视频摘要方法。利用改进后的ViBe对视频序列进行背景建模,去除不包含前景对象的视频帧,将其余帧保留下来生成浓缩后的视频,以达到减少视频文件对存储造成的压力的目的;在获取到前景对象后建立属性分类器,利用属性学习对前景对象进行概念检测,检测出相应概念后利用属性标签来描述该前景对象,由此在浓缩的视频基础上生成视频摘要。本文研究的主要内容如下:(1)提出了基于改进ViBe的视频背景建模与浓缩。在对视频背景建模算法进行研究对比后,选择较其他主流方法速度快、占用内存少的ViBe算法。针对原ViBe算法在实际监控场景下仍会存在噪点和闪烁点以及在初始化过程中会引入鬼影的问题,对ViBe算法进行改进,分别提出了基于计数点阈值的闪烁点去除方法,基于形态学的噪点消除方法,和面向鬼影区域检测和抑制的改进算法。在实现并实验验证了对ViBe的改进后,将其应用于前景提取与视频浓缩中去。首先对视频进行背景建模,获取前景对象。而后将不包含前景对象的无用帧略去,以达到去除时间维度上的冗余信息的目的,对视频进行浓缩。(2)提出了基于多核属性学习的前景多概念检测与摘要。首先将多核学习引入直接属性预测模型框架中,给出了对核函数的权重向量进行优化求解方法;进一步地,将提出的模型运用视频对象分类中;继而利用模型的多概念分类能力和属性描述能力,对监控视频前景多概念进行检测,并给检测出的对象加上属性标签,生成视频摘要;最后,设计对比实验对提出方法的有效性进行验证。(3)在前面两个研究点的基础上,运用软件工程中面向对象的思路搭建基于背景建模和属性学习的视频摘要原型系统。系统包含视频浓缩模块、属性预测模型训练模块、视频摘要模块。运行效果良好,达到了本研究的预期目标。