复杂场景下的人体行为识别

被引量 : 0次 | 上传用户:paltx3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,在过去的几十年里,我们见证了视频数据在生活中无限泛滥。在很多领域,能够自动理解视频内容就变得越来越重要。人的行为是视频内容中的重要组成部分,已经存在很多重要的研究工作是对视频中人的行为进行分析。但是,已提出的大部分研究方法都是基于简单场景特性的数据的研究,很难被应用到实际场景下人体行为的分析。在本文中,我们研究了实际场景下的人体行为识别,包括三个部分,多模态的人体行为识别方法;基于时空兴趣点选择的人体行为识别;基于局部特征全局背景的人体行为识别。传统的人体行为识别的方法在动态背景等因素的影响下,已经不能满足复杂场景下人体行为识别的需要。我们通过对复杂场景下人体行为的特性进行分析,发现实际场景中的声音和行为有一定的对应性,例如电话铃声会伴随接电话的行为,因此,将实际场景中的声音信息加入到人体行为识别中,形成多模态(声音模态和视觉模态)的人体行为识别系统。另外,实际场景下人体行为所对应的声音信息存在多样性的特点,我们使用推广的多核学习的方法来挖掘更有效的声音特征。在最终决策时,我们使用模糊积分融合的方法,对声音和视觉两个模态的识别结果进行了决策层的融合。实验结果证明了我们提出的多模态人体行为识别系统能够得到更好的识别性能,同时也揭示了声音背景是如何帮助有效识别实际场景下的人体行为。时空兴趣点已经被成功地应用于人体行为识别中,然而在实际场景中获取的大部分兴趣点与表征实际场景下的特定人体行为是无关的。因此,本文提出了一种删除无关时空兴趣点的方法,从而达到降低计算量并提高识别性能的目的。基于对注意机制的感知原理的分析,视觉显著性能够帮助定位视觉中的行为主体,因此我们根据显著图来选择相关的时空兴趣点,将未落入显著区域的兴趣点认定为无关的噪声点删除。实验结果证明了我们提出的方法可以减少计算量,并且能够提高系统的识别性能。实际场景下的人体行为存在多样性的特点,因此如何对实际场景下的人体行为进行表征,就成了一个极具挑战性的研究课题。基于Bag-of-features模型的人体行为识别系统将人体行为表征成基于行为视频中关键点局部特征的分布。因此,用来表达各种关键点的局部特征相应地被提出。但是,这些局部特征却没有对关键点之间结构化的位置关系进行表达。在本文中,我们提出了使用形状背景描述符来表达这种结构化的信息,每个关键点由局部视觉属性,以及关键点相对于其他关键点之间结构化的全局背景来共同表征。实验结果证明了,我们提出的加入结构化信息的行为表征方法,在实际场景下具有更强的表征能力。另外,我们也研究了不同的特征描述符(SIFT描述符、HOGHOF描述符、形状背景描述符)对实际场景下的人体行为的表征能力,同时发现,在致密的关键点下使用我们提出的结构化的全局背景能够取得更好的识别结果。本文的主要创新点可以总结如下:(1)本文提出了利用背景声音信息形成多模态的人体行为识别系统,更有效地对实际场景下的人体行为进行识别,本文的工作是首次使用多模态的特征来对实际场景下的人体行为进行识别。(2)本文利用推广的多核学习的方法,从大量的声音特征中挑选出能够对实际场景下的人体行为进行更有效表征的声音特征。(3)本文提出了利用模糊积分融合的方法,在决策层对多模态的信息进行融合,取得了更好的识别性能。(4)受到人的感知原理的启发,基于视觉注意机制的显著图被提取,由于视觉显著性能够帮助定位行为的主体,因此可以用来确定图像中的相关兴趣点,未落入显著区域的兴趣点被视为是无关兴趣点而被删除。(5)本文提出了利用形状背景描述符来描述局部关键点的结构化的位置关系,因此,每个关键点可以被描述成它的局部视觉属性,以及关键点相对于其他关键点之间结构化的全局背景的共同表达。
其他文献
针对手部残疾者独立阅读的需要,本文设计一种简易自动翻书机,利用负压吸附原理,通过单片机控制电机实现翻书动作。主要进行翻书系统的总体设计,包括负压系统、传动系统以及电
本文首先综述了表面工程领域中激光熔覆再制造技术的研究现状与发展趋势针对目前炉辊和辊环等高温工件存在的高温辊面涂层材料低耐磨性与热震损伤等技术难题,本文采用激光熔覆
人力资源是企业发展的重要推动因素,是企业管理的主要内容。但是,我国目前对人力资源管理的应用还处于较低水平,特别是一些国有中小企业,在人力资源体系的建设以及人力资源的开发
<正>俗话说"没有规矩不成方圆",社会秩序的建立需要以制度为基础。而且,制度也存在于社会的各个方面,可以表现为多角度、多层次的,也可以根据统治阶级的需要加以变革。玉器的
期刊
<正> 近年来,我从事小学低年级作文教改实验,尤其在二年级由说话训练到写话训练的过渡阶段,有过一些教学体会。我觉得,要使学生“有话可写”,关键要开发他们的想象力。脑子能
<正>2014年5月30日9时20分12秒,云南省德宏州盈江县发生6.1级地震,震源深度12公里,距盈江县城37公里,盈江县震感强烈,梁河县、瑞丽市、芒市、陇川县、腾冲县等地震感明显。此
<正> 我科在1958年8月至12月间曾应用南瓜子治疗慢性血吸虫病六例,现作一初步报告。(一)材料与方法:所用南瓜子是熟的,在干菓铺中买来后,将瓜子磨成粉,或做成馒头(用去油南瓜
本文以《博雅汉语》起步篇Ⅰ、Ⅱ与《新攻略汉语》基础篇、初级篇为研究对象,依据对外汉语教材编写相关理论,课文、词汇、语法、练习这四方面对两部教材进行了比较。探讨汉语教
简要介绍赢得值法的概念及并行工程模式下总承包项目成本控制的特点,重点介绍赢得值法在总承包项目设计阶段成本控制的主要方法及模拟实例分析。
派生诉讼制度最早起源于英国的衡平法,现代已经发展成为两大法系中股东权利救济的重要手段之一。2005年我国修订《公司法》,正式创立了这项制度,至今已走过了7年的时间,也取