融合深度特征的人体行为识别技术研究及其在视频侦查中的应用

来源 :武汉大学 | 被引量 : 0次 | 上传用户：pengguanxin

【摘要】

：

我国视频监控系统的建设和普及给公安机关侦查破案方式带来了巨大变革,视频侦查技术得到极大的发展与应用。但是,在实际视频侦查工作中,监控视频检索问题由于缺乏与之对应的

【作者】

：

徐增敏

【出处】

：

武汉大学

【发表日期】

：

2019年01期

【关键词】

：

人体行为分析半监督学习深度学习多目标行为识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

我国视频监控系统的建设和普及给公安机关侦查破案方式带来了巨大变革,视频侦查技术得到极大的发展与应用。但是,在实际视频侦查工作中,监控视频检索问题由于缺乏与之对应的结构化文本描述,所以目前视频侦查工作仍然需要通过人工排查的方式,对视频内容进行对比分析才能发现异常行为事件。有别于基于内容的通用视频检索技术,一般关注具有明确语义属性的某一类行为或事件,而视频侦查感兴趣的是不同行人目标的特定行为。此外,实际城市视频监控中行人对象的画面质量较差、尺度较小,而且还存在明显的遮挡、视角、光照变化。这些因素使得面向视频侦查的监控视频检索问题比一般视频检索要更加困难。人体行为识别作为视频侦查的关键技术,能理解视频目标对象的行为语义特性,帮助甄别关键嫌疑要点,引起了广泛关注。近年来,人体行为识别成为研究热点,在公开数据集上已取得很高的准确率。但是,当条件复杂化后人体行为识别性能显著下降,这无法满足视频侦查应用的实际需求。非限定条件人体行为识别研究复杂化体现在:场景复杂化、分布复杂化、度量复杂化、应用复杂化。在这四个方面的技术瓶颈表现为:(1)受到监控环境因素、器件成像因素等原因的影响,实际视频侦查中监控场景环境多变。视频场景更为复杂,传统基于全局强角点稠密轨迹特征采样在背景噪声干扰下辨识能力下降。(2)实际视频侦查中,往往无法获得足够多的异常行为训练样本,训练与测试样本特征空间分布不一致,训练不全面导致模型不能泛化到新的类别上。样本分布更为复杂,深度学习模型在小数据集上容易过早收敛。(3)分类优化模型依赖于样本全局相似关系,然而实际视频侦查中,训练集特定类别样本和全局相似样本稀疏。距离度量更为复杂,原始特征空间中样本匹配的分类模型性能受限。(4)监控视频分析通常需要从复杂场景下多个行人目标中,找出特定关注的异常行为或突发事件。应用需求更为复杂,一方面长时视频突发异常行为事件缺乏样本数据和协同训练,另一方面监控视频画面中需要同时对多个人员目标进行动作识别。为此,本文开展面向条件复杂化的人体行为识别研究,重点在人体动作描述、行为样本测距、距离度量调优、多目标行为识别等四个方面进行理论研究和实践应用,取得了如下创新性成果:(1)基于显著运动边界的人体动作描述针对场景复杂化,监控场景环境多变且强角点多,稠密轨迹特征采样在背景噪声干扰下辨识能力下降的问题,利用基于区域对比度的显著边界检测方法,提出基于显著运动边界的稠密特征采样方法,对人体行为的动作序列进行特征建模,提升人体行为识别的动作辨识能力。实验结果表明,本文提出方法在Hollywood2、HMDB51、UCF50的平均识别率,对比选定基准方法分别提升了2.2%、3%、1.5%.(2)基于半监督判别流形的分类器设计针对分布复杂化,异常行为样本少而正常行为样本多,深度学习模型在小数据集上过早收敛的问题,利用基于判别流形学习的投影矩阵求解方法,提出基于半监督图模型的分类器设计方法,对分类模型的训练方法进行半监督化,提升人体行为识别的模型泛化能力。实验结果表明,本文提出方法在JHMDB、HMDB51、UCF50和UCF101上的识别率,对比选定基准方法分别提升了4.06%、3.92%、5.06%和3.39%.(3)基于核化邻域嵌入的距离度量调优针对度量复杂化,格拉斯曼空间上全局相似样本稀疏,原始特征空间标注样本较少影响模型训练性能的问题,利用基于再生核希尔伯特空间的核函数组合优化方法,提出基于核化格拉斯曼流形的距离度量调优方法,对相似样本的度量方法进行核函数化,提升人体行为识别的模型组合能力。实验结果表明,本文提出方法在JHMDB、HMDB51、UCF101上的识别率,对比选定基准方法分别提升了2.97%、2.59%、2.40%.(4)面向视频侦查的多目标行为识别针对应用复杂化,某个时段同时出现多个不同类行为,人员活动区域可能存在遮挡且标注信息不足的问题,利用目标检测和多目标跟踪算法分割人员活动区域,提出基于多纤维残差网络和伪标注深度学习的协同训练方法,增加未标注样本的弱标注信息,提升网络模型的训练效果,并根据视频侦查的应用需求,研制了一套多目标行为识别系统。实验结果表明,本文提出方法在HMDB51第一分组上使用5%、15%、30%标注样本,其余作为未标注样本协同训练后的识别率,对比选定基准方法分别提升了2.36%、6.01%、3.09%.多目标行为识别系统能同时跟踪多个行人目标,并有效标注各自活动区域的行为类别。

其他文献

探究式学习对高中生英语阅读素养的影响研究

新版《普通高中英语课程标准,》强调教学目标由培养学生的综合语言运用能力转变为培养学生的英语学科核心素养。阅读素养属于英语学科素养,包括阅读能力和阅读品格两个方面,

学位

高中英语阅读探究式学习5E模式阅读素养

试论杂技与舞蹈的融合

杂技与舞蹈既相互联系,又各有侧重。随着社会进步,很多杂技逐渐舞蹈化、舞蹈逐渐杂技化,这是杂技与舞蹈在发展过程中相互借鉴、相互吸收、相互融合的必然趋势。杂技与舞蹈的

期刊

杂技舞蹈融合创新

新移民文学女性经验的独特诠释——旅加中英文双语作家李彦访谈(下)

李彦数十年"为新移民女性立传"的独特价值,在于以"内倾式"书写女性的"命运之变""灵魂之痛",其生存浮萍与精神脊梁之悖论,构成内在生命真相的多样性。她对母亲形象的塑造与母

期刊

新移民文学女性经验《嫁得西风》《海底》

野猪种群动态影响模拟预警系统的构建与研究

从上世纪开始人们逐渐意识到保护自然环境和保护野生动物的重要性。在欧洲、非洲、亚洲等地都建立很多自然保护区,禁止人们砍伐森林和捕杀野生动物,使得自然环境得到缓慢恢复

学位

易泛滥种野猪预警系统种群数量生境面积和质量凤凰山自然保护区

杭州余杭区农田耕层土壤有机碳空间分布特征及其影响因素

利用杭州市余杭区耕地地力调查采集的2 814份土壤样品,基于GIS技术研究了余杭区耕层土壤有机碳(topsoil organic carbon,TOC)的空间分布状况,并探讨了影响该地区TOC的因素。

期刊

耕层土壤有机碳空间分布有机碳密度

杂交稻谷的出率问题探讨

期刊

杂交稻谷出品率砻谷机出米率问题探讨

广西高校与越南高校体育专业人才培养模式比较研究

广西与越南在高等教育方面交流频繁,双方在高等教育的合作方面也形成了一定的规模。但是,广西与越南高校体育专业之间的交流却相对较少,人们对越南高校体育专业的人才培养模

学位

广西高校越南高校体育专业人才培养模式

2型糖尿病心肌改变的心血管磁共振成像研究

背景与目的2型糖尿病（type 2 diabetes mellitus,T2DM）是常见的慢性病,发病率呈上升趋势。T2DM合并多种并发症,其中心肌损伤是发病率和死亡率最高的并发症。T2DM患者可在没有并

学位

2型糖尿病心血管磁共振T1 mapping计算红细胞压积细胞外容积分数分形维度同心圆型重构特征追踪技术左室功能左房功能

用于光声成像的宽带超声换能器的研究

超声检测(UT)作为无损检测(NDT)的主要方法之一,具有穿透力强、灵敏度高、安全(机械波)、实时性、便捷易操作等优点,成为工业、医疗等领域中使用频率较高的检测方式。超声换

学位

等效电路有限元电容式微机械超声换能器工艺分析光声成像

思维导图在小学数学“图形与几何”教学中的应用研究

本研究是依据《义务教育数学课程标准(2018修订版)》和小学生的身心发展特点,将思维导图应用于小学数学“图形与几何”教学中,从而验证了思维导图的有效性。本研究运用文献研

学位

思维导图小学数学图形与几何

融合深度特征的人体行为识别技术研究及其在视频侦查中的应用

与本文相关的学术论文