论文部分内容阅读
随着科技的进步与智慧城市概念的普及,以及诸如城市大脑等项目的实施与发展,城市监控逐渐走向自动化、智能化,而这种变革,需要结合计算机视觉等相关技术来解决传统非智能监控的一些问题,比如需要人工监控、存储信息冗余、检索困难、无法自动分析视频内容等。异常检测作为计算机视觉一大领域,由于其能够自动分析监控视频内容并监测异常,以避免灾难的发生与蔓延,对于智慧城市安全工作的建设和发展,具体重要的战略意义和研究价值。安防监控拍摄的人群场景画面十分复杂,主要体现在:(1)受天气、拍摄时间等影响,拍摄的监控画面可能十分昏暗,导致运动目标与背景很难区分;(2)异常具有场景依赖性,不同场景的异常定义不一样,且监控画面一般广角较大,景深问题严重。这些问题给异常检测算法带来了诸多挑战:(1)普通的目标检测容易漏检与背景相似的运动目标,影响后期目标状态分析;(2)监控画面里场景多样,导致不同位置异常定义不一,单一的特征或分类器极易导致异常检测分类不准。本文针对上述挑战,研究基于运动目标及块分类的人群场景异常检测方法,以提取具有语义理解的处理单元,并解决如何充分利用时空信息及摄像头广角大导致不同位置异常定义不一的问题,最终提高异常检测算法性能。本文主要的研究内容及创新点如下:1.提出了一种基于运动目标的昏暗人群场景异常检测算法,针对目前异常检测算法大多数处理单元缺乏语义理解,容易将单个目标分裂成多个,影响后续异常分析,本文使用深度目标检测提取运动目标。为了保证目标检测在昏暗场景的精度,本文将运动及外观信息结合起来形成一种新的动态图,以提高运动目标在昏暗场景里的显著性。基于检测到的目标,本文提出一种高效、对尺度不敏感的名为光流角度直方图方差的特征用于检测运动异常。同时,本文对视频场景背景进行建模,以根据获得的非活动区域进行位置异常判定。实验结果表明,与现有算法相比,本文提出的算法可以在公开数据集上具有较好的异常检测与定位效果。2.提出了一种基于多特征及块分类的人群场景异常检测算法,用来解决摄像头广角大、拍摄画面里场景多样化导致的异常定义随位置变化的问题。为了提高异常检测的精度,本文提出块分类,将拍摄场景平分为多个块,每个块学一个分类器,以解决不同位置衡量标准不一的问题。为了检测运动异常,本文同时使用短时及长时运动特征,以更加全面地对运动目标进行分析。最后,本文提出一种目标再定位算法,以重新定位由于目标过小、遮挡等导致的漏检异常目标。实验结果表明,与现有算法相比,本文提出的算法能够较好地检测异常,并且定位准确。