基于深度学习的人体异常行为检测技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:danNyZ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能监控技术的不断发展,视频监控设备被广泛地部署在学校、地铁、道路、工厂、小区等人员密集区域,它们给人们生活带来了安全与方便,但也有不少挑战随之而来,其中之一便是如何从海量的视频数据中检测出人体异常行为。这些异常行为的检测也是目前计算机视觉领域研究的热点和难点。根据拍摄设备的不同,可以把视频分为普通视频和带有距离信息的视频。本论文的研究对象是普通视频,包括近景和远景视频。近景视频是指摄像机与运动目标距离较近的视频,它侧重于人的上肢动作,尤其是手部动作;远景视频是指摄像机与被拍摄目标的距离超过一定范围的视频,它侧重于人的整体运动。本论文的研究工作主要围绕检测近景和远景视频中的异常行为而展开,具体可分为以下几方面。面向近景异常行为检测的肤色分割算法。在近景异常行为检测中,背景信息不但无法提供有效帮助,反而会增加算法后续处理的运算量,为了去除运动目标的背景,本文采用肤色分割的方式获取肤色区域。传统的肤色分割算法主要借助像素点在各个颜色空间下的数值及纹理等特征建立肤色统计模型,但光照和年龄变化容易带来肤色表征变化,单像素点的信息并不能完整地表示它们。因此,论文提出了一种基于堆栈自编码器的肤色分割算法,以肤色块为基本处理单元。实验表明,该算法在多个肤色分割数据集上取得了较好的肤色分割结果。基于肤色分割的近景异常行为检测。论文提出了一种基于肤色分割的近景异常行为检测算法,该算法分为背景去除、手掌定位与追踪、能量检测和运动轨迹识别四个部分。背景去除方面,考虑到拍摄时的光照变化,本文采用基于亮度索引的肤色分割算法:先通过基于自编码器的肤色分割模型获得当前图像中置信度最高的一部分肤色,再采用颜色空间中的亮度分量对这部分肤色信息进行分类,最后在多个亮度索引下分别建立动态肤色分割模型。该模型既去除了背景中的干扰信息,又有利于后续算法快速定位当前图像中的人体肤色区域;手掌定位与追踪方面,在肤色分割的基础上,结合手掌几何特征实现了手掌或手臂的定位,用Camshift算法进行追踪;能量检测方面,对追踪的手掌或者手臂进行光流能量计算,根据其能量是否超过设定的阈值来判断是否为异常行为;运动轨迹识别方面,用改进的动态时间规整算法识别手的运动轨迹。实验表明,论文中的近景异常行为检测算法可以有效地检测出近景视频中的异常行为。面向远景异常行为检测的卷积神经网络模型改进。卷积神经网络(Convolutional Neural Networks,CNN)是一种由卷积层、下采样层、全连接层和分类层构成的深度神经网络。在分类任务中,CNN学习到的高层特征具有很强的区分能力,并在多个分类数据集上超越了传统的人工特征,但在物体检测任务中,CNN存在一些不足。针对这些不足,本文从以下几方面对CNN模型进行了改进:特征融合方面,通过越层连接策略和上下文学习策略实现局部信息与全局信息的融合。越层连接策略是将CNN网络中的低层与高层特征按照一定的比例融合,这样既能保留物体的空间信息,又能保证高层特征在物体检测任务中的主导地位。上下文学习策略是在感兴趣区域池化操作中平行地加入上下文池化操作,将池化产生的特征按一定比例融合,可以实现局部信息与全局信息的再次融合;优化候选区域方面,通过优化可以更精准地找出物体或者异常行为在图像中发生位置。实验表明,该算法在VOC和UCF sports等数据集上取得了较好的结果。基于多流卷积神经网络的远景异常行为检测。在远景行为视频中,场景信息与一些行为有着显著的映射关系。本文将场景识别CNN和行为检测的双流CNN组成远景异常行为识别的多流CNN模型,在基于CNN的场景识别算法中做了以下几点改进:用均匀采样替代原有的随机采样,避免训练数据中出现某一块区域过采样的问题;采用不同的网络提取场景特征与物体特征,并将其融合形成新的场景特征;用场景识别CNN产生的“场景-行为”映射关系表,改善双流CNN的检测结果。实验表明,该算法在UCF101数据集上取得了较好的检测结果。
其他文献
旅游业已经发展成为全球第一大产业,在大众旅游时代,游客对旅游服务的追求越发趋向于多元化与个性化,现代旅游业的快速发展对旅游人才的职业要求日趋增高。旅游服务人员常借助语言这一载体完成对客服务,旅游服务人员的语言表达能力水平直接体现了旅游服务人员专业素养的高低,从而影响着旅游服务质量。因此,提升旅游服务人员的语言表达能力,有利于促进着其综合职业能力的形成,有助于拓宽旅游服务人员职业生涯的广度与深度。中
目的:探讨尿激酶联合低分子量肝素钠治疗急性脑梗塞的临床疗效。方法:80例急性脑梗塞患者随机分为 两组:治疗组40例和对照组40例。两组患者均采用一般药物治疗及对症治疗。
由于中项所处位置不同,直言三段论分成了四个格。在四个格中,第一格的有效式最典型的体现了三段论的演绎性质,它们的正确性是不证自明的;同时,从第一格三段论中能推出A、E、I
近年来飞速发展的兰花产业,成为中国花卉业的重要组分,但发展中存在着一定的盲目性。基于此,有必要借鉴已趋成熟的国际兰花产业的发展经验和思路,以获悉不同种类兰花的适宜发
贸易保护是指国家通过一系列措施限制对外国产品的进口为本国的民族工业提供宽松的发展空间,世界各个强国的崛起之路也都或多或少的经历了一段贸易保护之路,然而贸易保护也有可
介绍了Linux内核防火墙的发展,对2.4.x内核中的Netfilter框架的流程和IPv4协议栈中Netfilter的实现进行了分析,通过一个内核防火墙模块实例介绍了基于Netfilter框架下的内核防
利用能量色散X射线荧光光谱仪、X射线衍射仪、电感耦合等离子体发射光谱仪、热电离质谱计对吉州窑窑址出土原料、窑址周边采集植物灰、窑址周边开采的现代制瓷原料和吉州窑黑
纵观成本管理理论发展的历程,从最初的成本核算、标准成本管理、目标成本管理到如今的战略成本管理、全面成本管理,是科技进步和市场竞争共同推动的结果,也是人们对成本本质
<正> 吉州窑是我国现存规模最大的古代瓷窑遗址之一。古代吉州窑的能工巧匠,以其高度的智慧,娴熟的技艺,创造了无数的瓷器工艺杰作,开放了光彩夺目的艺术之花。 吉州窑名瓷,
<正>近年来,国家高度重视中小企业问题,出台一系列政策措施扶持中小企业发展。现对2010年规模以上工业企业部分统计数据进行分析,以反映中小企业在国民经济中的地位和作用。