基于3D骨架和流形的人类行为识别方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:colossus198201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类行为识别近年来已经成为计算机视觉领域最热门的研究课题之一,其被广泛应用于视频监控、视频游戏和人机交互等相关领域。在过去十几年里,研究人员提出了大量基于RGB视频序列的行为识别方法并且取得了不错的识别效果。然而,传统RGB数据对于许多因素都是极其敏感的,如光照条件、尺度变化和数据遮挡等,这都将影响行为识别的准确率(识别率)。此外,传统单目视频传感器不可能精准地捕获3D空间中的人类运动。近年来,随着RGB-D摄像机的发布,从视频序列中提取人类骨架已变为一项相对容易的工作。与传统RGB视频序列相比较,基于骨架的行为序列对于上述不利因素更具鲁棒性,这就使得越来越多的科研工作者投身于基于骨架的行为识别研究工作中。本文通过研究人类行为的3D骨架序列,首先利用李群来描述骨架序列中刚体间的相对几何和相对旋转,并以此为基础来解决骨架序列中的噪声问题。随后使用张量分解的方法来获取刚体间的线性关系,构建基于非负张量的线性动态系统来模拟骨架间的时序关系。最后利用刚体活跃水平来发掘行为序列中表示身体运动的高维特征,并将这些高维特征映射到流形空间中,以克服骨架构型的不利影响。总体来说,本文的贡献和创新点包括以下三个方面:1.针对如何处理不同客体间的尺度变化、获取同一行为序列中不同骨架间的时序信息和排除行为序列中的噪声骨架等问题,本文从行为的李群表征中挖掘关键骨架模式来解决上述三个问题。具体步骤分以下三步:第一,为了捕获尺度不变的空间信息,骨架中任一刚体的方向都由六个旋转矩阵来表征,这些矩阵代表了该刚体和三个坐标轴之间的旋转。每一个旋转矩阵都被投影到特殊正交群S O(3)上。第二,利用刚体在不同骨架间的运动来表征3D骨架序列的时序信息。类似地,这些刚体运动被映射为特殊欧式群S E(3)上的几个点。在以上两步的基础之上,一个表征人类行为的骨架序列就可被看作为在李群(S E(3)×···×S E(3),S O(3)×···×S O(3))上的一个点集。第三,提出了一个由Prefix Span算法改进的模式增长算法,用以从基于李群的行为表征中挖掘关键骨架模式。该算法通过在每个增长步中减少新模式的数量来提高搜索效率。2.由于线性动态系统是一种有效的时空数据编码工具,因此本文在行为序列的非负张量表征下,拓展了传统线性动态系统的参数估计方法,分析了基于非负张量的3D骨架序列的优势。首先,本文将每一个人类行为都表征为三阶非负张量形式。在此基础之上,提出一个基于非负张量的线性动态系统来模拟这些行为,并使用非负Tucker分解来估计这个线性动态系统的参数。最后,将由这些参数构建的行为描述符映射到无限Grassmann流上,利用在该流形上的字典学习和稀疏编码对人类行为编码,使用SVM对编码后的人类行为进行分类。3.为了排除掉行为中的噪声关节,本文提出了一种基于Kendall预形状的行为识别模型,其利用骨架序列中的活跃关节来表示人体实际运动的部分。然后将每一副骨架中的活跃关节坐标映射到Kendall预形状空间中,以获取形状不变的骨架构型。因此,一个人类行为就可以被看作为一个在Kendall预形状空间上的点集,在此基础之上,使用基于张量的线性动态系统(t LDSs)来描述骨架间的时序关系。
其他文献
随着宽带业务的迅猛增长,数据中心的规模不断扩大,数据量及新的应用增长迅速,直接在光层完成信号的数据交换已成为趋势,而传统的交换设备已无法适应全光网络快速发展的需要。在这种情况下,全光交换技术中的核心光交叉连接(OXC)的重要性就日益显现,而光开关阵列是OXC中的关键器件。本文主要针对光交叉连接(OXC)中基于MEMS的光开关阵列设计展开研究,论文的主要内容包括以下几个方面:1.论文介绍了1×N的M
自从进入到21世纪以来,我国科技实力逐渐提高,我国正在加速迈入5G时代,依靠网络切片,能够建立实现用户差异化需求的虚拟化逻辑网络,并且各个用户使用时不受影响,相互独立,它可以搭建一个既灵活又便捷的5G网络,进而使用户获得更良好的使用感。本论文通过研究网络切片在5G承载网中的应用进展,得出了当前5G承载网存在的问题和局限:目前的承载网管控融合系统能够把底下承载的设备的资源抽象成网管管理的对象,来进行
随着全球定位系统(GPS)技术的快速发展,它已经成为了我们生活中非常重要的一部分。它使得我们的生活变得便利,同时它在军事上的贡献是巨大的。然而,同时GPS信号也特别容易受到干扰。因此,对于我们来说,如何加强GPS信号并抑制干扰就成为了一个必须解决的问题。国内关于GPS干扰与抗干扰的技术领域内的研究已经起步,而同时随着北斗卫星的广泛应用,抗干扰的问题也越来越受到人们的重视。在我的这篇论文中,我研究了
随着5G、人工智能、物联网等新业务加速部署,地址资源限制越发明显,IPv6海量的地址资源以及其安全特性已经让业界达成了IPv6是未来产业转型基础的共识。SRv6技术就是基于IPv6技术,对数据报文进行转发处理,简化流程,提高效率,降低了网络协议部署的复杂度。本文的主要工作如下:(1)介绍网络处理器的基本原理、VPN的概念以及转发原理,L3/L2VPN业务流程和功能;(2)阐述SRv6的头部扩展格式
目前,国内的水污染源数据采集系统往往只能报送单一污染源因子,适应性、扩充性较差。由于人们生活水平的不断提高,给水污染防治工作带来了更高的要求和挑战,该背景下,当前水污染源数据采集系统已经不能满足环保和监控的需求。为此,必须加强创新,快速研制出一款水污染源在线监控系统,确保可以更好的满足水污染源监控系统所出现的新需求。
随着社会经济的进步与发展,财务管理的理论研究工作也在不断深入,同时逐渐形成了一套比较成熟的理论体系。将财务管理的理论引入到税收筹划的研究工作中,非常有利于完善税收筹划理论体系的建设与完善,给之后的实践活动提供客观有效的指导。本文主要分析了战略管理视角下,高新技术企业税务筹划的相关探究。
税收是国家财政收入的主要来源,税法明确规定纳税是企业应尽的义务。高新技术企业在税收方面具有一定的优惠,高新技术企业的税务筹划是研究在法律许可的范围内通过调整各类事项规范经营活动和投资环节,从而促使企业的税额尽可能降低。近年来国家的扶持政策为高新技术企业的发展提供了帮助,为企业实现税收节约,提高企业核心竞争力。对此本文针对高新技术技术税务筹划进行了分析,并以A企业为例,探讨了A企业的税务筹划应用情况
宋代社会的变革,使宋代经济具有了某些现代的因素,主要包括劳动者人身依附的减弱与租佃雇佣经营的盛行,商品经济的市场化发展,产业分工程度的提高与生产技术的进步。宋代经济不仅对中国历史产生重大影响,也对世界现代社会的产生有重大的影响。宋代经济结构也发生了显著的变革:国家调控经济能力增强与国营经济的经营方式的变革,公共组织与公共经济的兴起,民营经济的不断成长。这些变革都是受商品经济刺激的结果,因此也透露出
在社会主义市场经济不断发展的同时,高新技术企业越来越受到重视,具有良好的发展前景和广阔的空间,企业面临的竞争环境也越来越复杂。高新技术企业的重点在于利用科技研发核心技术产品,所以企业的资金投入量很大。高新技术企业需要利用税务筹划有效地控制生产经营成本,加大对技术创新的投入,减轻企业的税负,提高企业的盈利水平。本文主要探讨高新技术企业税务筹划过程存在的问题以及提出整改策略,合理地规避企业风险,增强税
有源相控阵天线是现代国防和商业通信中至关重要的电子装备,涉及各种先进信息化作战平台、总体指挥控制系统、5G通信基站和智能物联网等,目前正朝着高频段、高抗干扰能力、高可靠性和轻量化的方向快速发展。与此同时,有源相控阵天线的结构参数、馈电参数和电性能间的机电耦合关系越来越紧密,由器件性能偏差、制造装配精度和时变服役载荷导致的不确定性参数对有源相控阵天线电性能的恶化程度也越来越严峻。如何在设计阶段保障有