基于深度学习的暴力检测及人脸识别方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：baotong1029

【摘要】

：

随着"平安城市"建设的不断推进,公共安全逐渐成为人们关注的热点问题,视频监控技术也随之得到了越来越广泛的应用,传统的视频监控系统主要提供采集存储功能,这远远无法满足人

【作者】

：

丁春辉

【出处】

：

中国科学技术大学

【发表日期】

：

2017年期

【关键词】

：

公共安全智能视频分析深度学习暴力检测人脸识别单样本低分辨率海云协同

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着"平安城市"建设的不断推进,公共安全逐渐成为人们关注的热点问题,视频监控技术也随之得到了越来越广泛的应用,传统的视频监控系统主要提供采集存储功能,这远远无法满足人们对其智能化的需求。要实现智能化的视频监控系统,以下几个关键问题亟需解决:(1)如何快速发现监控视频中的异常行为,及时给出警报,并最大限度地减少误报和漏报现象;(2)如何在多种不利因素下(如单样本,低分辨率)对可疑目标进行准确的识别分析;(3)在海量数据的情况下,如何确保视频分析系统的实时性及准确性。近年来,深度学习在机器视觉、语音识别和自然语言处理等多个领域都取得了优异的成绩,这也为智能视频分析技术的发展带来了新的契机。因此,本文基于深度学习的方法对上述相关问题展开研究,主要研究工作与创新如下:1.针对监控视频中的异常行为尤其是暴力打斗行为难以准确快速发现的问题,提出了一种基于三维卷积深度网络的暴力检测方法。该方法利用大量带标签的视频数据进行有监督的学习,通过将传统二维卷积核扩展为三维来提取视频中的运动信息,然后综合利用视频的空间信息及运动信息来构建深度神经网络模型,从而实现对监控视频中暴力打斗的检测。由于深层模型端到端学习的特性,所以不需要设计复杂的手工特征来描述运动信息,从而降低了任务的复杂度。实验结果表明,本文提出的方法在单一场景以及人群密集环境下都可以对暴力打斗行为进行准确识别。2.针对人脸图像在单训练样本下难以被准确识别的问题,提出了一种基于核主成分分析网络(Kerne1 Principle Component Analysis Networks,KPCANet)模型的二阶段投票人脸识别方法。该方法在不使用额外样本数据的情况下,利用非监督深层模型KPCANet对分块后的人脸图像进行训练并利用KPCA学习得到的滤波器进行特征提取,从而保证了提取的特征对光照及遮挡的鲁棒性,同时也消除了人脸局部形变对识别率的影响。本文通过投票的方法融合每一个分块的预测值来得到最后的识别结果,对于单次投票结果不唯一的情况,本文采取了二阶段的投票方法,通过扩大每一块的预测候选集,并对不同的区域赋予不同的权值来得出最后的结果,从而进一步提升了识别的准确率。实验结果表明,该方法在四个公开人脸数据集上都取得了优异的表现,算法准确率优于使用了额外数据集的通用方法,尤其是在非限制人脸数据集LFW-a上,本文提出的方法比SVDL和LGR方法准确率提升了约l5%。3.针对监控视频中人脸图像由于分辨率过低而无法准确识别的问题,提出了一种基于卷积神经网络模型的低分辨率人脸识别的解决方案。该方案提出了两种模型:多尺度输入的卷积神经网络(Convolutional Neural Networks,CNN)模型和基于空间金字塔池化(Spatial Pyramid Pooling,SPP)的CNN模型。(1)多尺度输入的CNN模型是对现有的"二步法"进行的改进,利用简单双三次插值方法对低分辨率图像进行上采样,再将上采样得到的图像与高分辨率图像混合作为模型训练样本,让CNN模型学习高低分辨率图像共同的特征空间,然后通过余弦距离来衡量特征相似度,最后给出识别结果。在CMU PIE和Extended Yale B数据集上的实验表明,模型的准确率要优于其他对比方法,相对于目前识别率最高的CMDA_BGE算法,准确率获得了 2.5%～9.9%的显著提升。(2)基于SPP的CNN模型,属于改进的"跨空间法",通过在CNN模型中加入空间金字塔池化层,使模型对于不同尺寸的输入图像都可以输出恒定维度的特征向量,最后通过比较样本库与测试图像的特征相似度就可以得到最后的识别结果。实验表明,相比多尺度输入的CNN模型,该方法在保持较高准确率的同时,省去了上采样的操作,简化了图像预处理的过程,同时也减少了传统"跨空间法"中需要学习的呋射函数的个数。4.针对监控系统中数据流传输带来的带宽占用问题以及对海量数据的快速准确分析需求,提出了一种基于"海云协同"的深度学习模型框架。海端系统利用深度学习的方法对本地数据进行训练得到局部模型,通过局部模型可以对数据进行快速检测,进而给出实时响应。海端系统通过上传局部模型和少量数据的方式协同云端训练,云端系统利用这些局部模型和数据构建更加复杂的深度模.型并进行调优,得到性能更好的全局模型。在MNIST、Cifar-10和LFW数据集上的实验表明,"海云协同"的方法有效地减少了数据传输的带宽消耗,同时也保证了海端的快速性和云端的精确性。上述方法已部分应用于中科院先导"海量网络数据流海云协同实时处理系统(XDA060112030)" 课题之中。

其他文献

切入口决定文章的走势与气势

<正>庖丁解牛的故事有很深刻的哲理。庖丁刚开始宰牛的时候,对于牛体的结构还不了解,看见的是整头的牛。三年之后,他对牛体结构了如指掌,见到的却是牛的内部肌理筋骨,眼中已

期刊

切入口创先争优活动国税局

另一种科学另一类哲学——女性主义立场论科学哲学评析

女性主义立场论是女性主义的一种形式。女性主义立场论科学哲学作为另一类哲学,对主流科学认识论的基础客观性进行了批判,并依据女性主义的立场,建构出自己的知识理论,即作

期刊

女性主义立场论客观性科学哲学科学文化

平调阴阳法对2型糖尿病患者生存质量及胰岛素抵抗的临床干预效果

目的探讨平调阴阳法对2型糖尿病患者生存质量及胰岛素抵抗的临床干预效果。方法 100例2型糖尿病患者分为单纯西药治疗对照组和复方炙甘草汤治疗组。两组均观察患者生存质量的

期刊

2型糖尿病平调阴阳法复方炙甘草汤生存质量胰岛素抵抗

激光:从发明到应用

本文通过对激光发明到应用过程中几个重要问题的历史考察 ,论述在激光这一具体技术领域的产生和发展过程中 ,科技、经济和军事的动力共同发挥着作用 ;阐明在这一过程中 ,科学

期刊

激光科学和技术的相互作用新技术的应用和不确定性微波激射器

事例·情感·哲理——谈谈演讲稿内容构成的三个要素

<正>一篇演讲稿的内容,是指它的内部所描述的事物的存在情况及其表达的情理内涵。从这个意义上理解,演讲稿的内容构成,离不开事例、情感和哲理这三个要素。经验表明,只有抓好

期刊

演讲稿内容构成

陶冶训练在手术室护理人员灾害救护能力培训中的应用

目的:探讨陶冶训练在手术室护理人员灾害救护能力培训中的应用效果。方法:由高年资护士负责编写案例,制定各种灾害的护理应急预案,设定模拟的场景,运用陶冶训练的角色扮演,进

期刊

陶冶训练灾害救护培训角色扮演

电梯门系统的常见安全保护装置与检验问题

随着城市化进程的发展,电梯这一垂直交通工具在人们生产生活中发挥着重要作用。电梯门系统属于电梯的主要组成部分,因而也成为电梯监督检验工作的重点。以电梯门系统为研究对

期刊

电梯门系统安全保护装置检验问题

针灸康复专业《中医骨伤科学》的教学应用

《中医骨伤科学》属于中医学科课程项目之一,该学科具较强的实践性,是研究人体的关节、骨骼、周围软组织等损伤的一门课程,该课程是通过多学科融合、渗透、交叉整合而成。课

会议

针灸康复中医骨伤科学教学

四联疗法治疗幽门螺杆菌阳性消化性溃疡的疗效观察

目的观察四联疗法治疗幽门螺杆菌阳性消化性溃疡的疗效。方法选择2011年1月～2012年1月本院收治幽门螺杆菌阳性消化性溃疡60例,应用四联疗法治疗,设为观察组;另选择同期应用三

期刊

幽门螺杆菌阳性消化性溃疡四联疗法

不同浓度的肝素封管液在血液透析中心静脉导管封管的临床观察

目的分析不同浓度的肝素对接受血液透析治疗患者的中心静脉导管进行封管处理临床效果。方法将42例血液透析治疗患者随机分为甲、乙、丙3组,各14例。3组患者均留置中心静脉导

期刊

血液透析中心静脉导管封管不同浓度的肝素效果堵塞出血

基于深度学习的暴力检测及人脸识别方法研究

与本文相关的学术论文