融合多特征的动作识别方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:xinwang01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近四十年来,计算技术、网络技术、存储技术等各项计算机技术全面高速发展,彻底影响和改造着人类的生活。计算机科学领域的研究者们除了从事计算理论的研究,对于计算机应用技术的研究也逐渐兴起。人体动作识别作为计算机视觉技术的一个重要且挑战性的题目引起了众多研究者的关注。尽管人体动作识别技术应用范围很广,但是尚未解决技术难题还有很多,例如:人体姿态变化较大、视角变化、背景杂乱等。处理动作识别问题的流行方法是基于视频局部特征进行分类识别。局部特征方法首先对视频提取局部特征,量化编码后再使用机器学习算法学习分类模型,最后对待测试的新样本进行分类。近几年来,深度学习方法在计算机视觉界发展迅速,研究者们基于深度学习理论提出了一些动作识别方法。这些方法的主要思想在于利用卷积网络自动学习视频帧特征后再进行编码分类。本文针对基于深度学习方法的双流网络(two-stream)模型以及基于视频局部特征的视觉词袋(BOVW)模型进行研究创新,提出了有效的动作识别方法。本文的主要工作体现在以下两方面:1.提出了基于哈希特征和双流网络模型的动作识别方法。经典双流网络模型没有关注视频中的关键帧,而是对视频整体提取特征。这样该模型难以提高类内差异性,从而影响了识别率。本文提出设定不同大小的哈希窗口,对不定长度的视频片段自适应地选取关键帧序列。首先,使用预先训练的经典网络模型提取CNN帧特征,对CNN帧特征做差值比较,将比较结果哈希映射为视频特征表达。然后,融合哈希特征与双流特征,将多种特征归一化。最后在多个数据集上进行实验评估。实验表明了二进制哈希特征对提高动作识别率的有效性。2.提出了结合视觉词袋模型和C3D网络模型的动作识别方法。经典视觉词袋模型可以对人体动作的局部特征进行高效地表示。C3D模型可以在空间尺度和时间尺度上对视频进行特征提取操作。深度网络特征倾向于关注人体脸部信息而忽略其他部位的信息,因此本文提出结合两种模型的特征融合方法用于动作识别。在一些数据集上的实验对比表明了该方法的有效性。
其他文献
本论文从基于java的贫困生信息管理系统的设计与实现建站的实际情况及国内外研究现状出发,经过对相关网站的分析,确立了本论文的研究内容:对项目需求进行调研,确定系统需求;在确定
抑郁症(major depressive disorder,MDD)是一种严重损害社会心理功能以及降低生活质量的常见疾病。世界卫生组织(World Health Organization,WHO)曾将MDD列为世界疾病负担的第三位原因,极有可能在2030年越居第一位。但由于MDD的临床表现多样性、病程和预后难以预测、治疗反应个体差异较大,因此对于MDD的诊断和治疗仍然是临床医生日常工作中的一大挑战
铁路是综合交通运输体系的骨干,作为“大国重器”,它对于推动经济社会的发展有着至关重要的功能和作用。2005年以前,福建铁路质量标准偏低,严重制约了福建经济社会的快速发展。经过十余年来的大规模铁路建设,目前福建铁路已形成“两纵五横”的路网框架,全面迈入高铁时代。目前,福建省铁路建设融资方式是以直接融资为主,即是政府利用财政拨款方式的融资,引入社会资本、发行债券等间接融资比重很少,投资主体及手段也较单
摘要:本文主要通过以VB为开发工具对Solid Edge进行二次开发,可以将开发出来的应用程序针对不同用户设置不同,这样不仅增强了仿真软件的高应用性,更主要地是方便一些不能够全面了解和学会运用Solid Edge的用户。本文主要分析VB在仿真软件中操控三维对象的实现。  关键词:VB;仿真软件;三维对象  中图分类号:TP311.52 文献标识码:A 文章编号:1007-9599 (201
摘要:本文介绍几款主流电容触摸感应技术,并研究它们的开发周期、检测技术及实现方式等。此文对产品开发具有参考意义。  关键词:电容触摸感应芯片;检测技术实现方式;开发周期  中图分类号:TP391.7 文献标识码:A文章编号:1007-9599 (2011) 20-0000-01  The Application Study of Several Capacitive Touch Detection
城市居民出行中,步行是最主要的出行方式之一。当行人步行前往陌生或不熟悉的环境中的目的地时,行人导航服务可以帮助行人完成在未知环境中的寻路行为,对于人们的出行生活具
一、南山污水处理厂概况南山污水处理厂服务范围东起福田区皇岗路,西至南山区前海、妈湾的特区中西部区域,服务面积103km^2,服务人口122万,占地面积42万m^2,设计处理水量为73.6万m^
采用能够充分发挥MOM与FDTD法各自优势的MOMTD/FDTD混合法,对任意形状线天线与近场媒质的相互作用在时域进行仿真计算。在对MOMTD/FDTD混合法进行验证的基础上,用MOMTD/(FD)。TD混合
"创新是一个民族进步的灵魂",而创新思维是创造力的核心,是创造力培养的最可贵的思维品质,在教学中培养学生的创造性思维能力,是教师面临的迫切任务.那么,如何培养学生的创新
基于UNCTAD-Eora GVC Database的出口国内附加值数据库,本文选取阿根廷、巴西、中国、印度等8个代表性新兴国家作为研究对象,从规模经济视角实证分析影响新兴国家参与全球价