论文部分内容阅读
我国视频监控系统的建设和普及给公安机关侦查破案方式带来了巨大变革,视频侦查技术得到极大的发展与应用。但是,在实际视频侦查工作中,监控视频检索问题由于缺乏与之对应的结构化文本描述,所以目前视频侦查工作仍然需要通过人工排查的方式,对视频内容进行对比分析才能发现异常行为事件。有别于基于内容的通用视频检索技术,一般关注具有明确语义属性的某一类行为或事件,而视频侦查感兴趣的是不同行人目标的特定行为。此外,实际城市视频监控中行人对象的画面质量较差、尺度较小,而且还存在明显的遮挡、视角、光照变化。这些因素使得面向视频侦查的监控视频检索问题比一般视频检索要更加困难。人体行为识别作为视频侦查的关键技术,能理解视频目标对象的行为语义特性,帮助甄别关键嫌疑要点,引起了广泛关注。近年来,人体行为识别成为研究热点,在公开数据集上已取得很高的准确率。但是,当条件复杂化后人体行为识别性能显著下降,这无法满足视频侦查应用的实际需求。非限定条件人体行为识别研究复杂化体现在:场景复杂化、分布复杂化、度量复杂化、应用复杂化。在这四个方面的技术瓶颈表现为:(1)受到监控环境因素、器件成像因素等原因的影响,实际视频侦查中监控场景环境多变。视频场景更为复杂,传统基于全局强角点稠密轨迹特征采样在背景噪声干扰下辨识能力下降。(2)实际视频侦查中,往往无法获得足够多的异常行为训练样本,训练与测试样本特征空间分布不一致,训练不全面导致模型不能泛化到新的类别上。样本分布更为复杂,深度学习模型在小数据集上容易过早收敛。(3)分类优化模型依赖于样本全局相似关系,然而实际视频侦查中,训练集特定类别样本和全局相似样本稀疏。距离度量更为复杂,原始特征空间中样本匹配的分类模型性能受限。(4)监控视频分析通常需要从复杂场景下多个行人目标中,找出特定关注的异常行为或突发事件。应用需求更为复杂,一方面长时视频突发异常行为事件缺乏样本数据和协同训练,另一方面监控视频画面中需要同时对多个人员目标进行动作识别。为此,本文开展面向条件复杂化的人体行为识别研究,重点在人体动作描述、行为样本测距、距离度量调优、多目标行为识别等四个方面进行理论研究和实践应用,取得了如下创新性成果:(1)基于显著运动边界的人体动作描述针对场景复杂化,监控场景环境多变且强角点多,稠密轨迹特征采样在背景噪声干扰下辨识能力下降的问题,利用基于区域对比度的显著边界检测方法,提出基于显著运动边界的稠密特征采样方法,对人体行为的动作序列进行特征建模,提升人体行为识别的动作辨识能力。实验结果表明,本文提出方法在Hollywood2、HMDB51、UCF50的平均识别率,对比选定基准方法分别提升了2.2%、3%、1.5%.(2)基于半监督判别流形的分类器设计针对分布复杂化,异常行为样本少而正常行为样本多,深度学习模型在小数据集上过早收敛的问题,利用基于判别流形学习的投影矩阵求解方法,提出基于半监督图模型的分类器设计方法,对分类模型的训练方法进行半监督化,提升人体行为识别的模型泛化能力。实验结果表明,本文提出方法在JHMDB、HMDB51、UCF50和UCF101上的识别率,对比选定基准方法分别提升了4.06%、3.92%、5.06%和3.39%.(3)基于核化邻域嵌入的距离度量调优针对度量复杂化,格拉斯曼空间上全局相似样本稀疏,原始特征空间标注样本较少影响模型训练性能的问题,利用基于再生核希尔伯特空间的核函数组合优化方法,提出基于核化格拉斯曼流形的距离度量调优方法,对相似样本的度量方法进行核函数化,提升人体行为识别的模型组合能力。实验结果表明,本文提出方法在JHMDB、HMDB51、UCF101上的识别率,对比选定基准方法分别提升了2.97%、2.59%、2.40%.(4)面向视频侦查的多目标行为识别针对应用复杂化,某个时段同时出现多个不同类行为,人员活动区域可能存在遮挡且标注信息不足的问题,利用目标检测和多目标跟踪算法分割人员活动区域,提出基于多纤维残差网络和伪标注深度学习的协同训练方法,增加未标注样本的弱标注信息,提升网络模型的训练效果,并根据视频侦查的应用需求,研制了一套多目标行为识别系统。实验结果表明,本文提出方法在HMDB51第一分组上使用5%、15%、30%标注样本,其余作为未标注样本协同训练后的识别率,对比选定基准方法分别提升了2.36%、6.01%、3.09%.多目标行为识别系统能同时跟踪多个行人目标,并有效标注各自活动区域的行为类别。