基于结构化表示模型的人体动作识别与运动分割

来源 :西安理工大学 | 被引量 : 3次 | 上传用户：zhufeng19791123

【摘要】

：

人体动作的理解与识别以及运动分割对许多智能系统来说是至关重要的,并广泛的应用于智能视频监控、视频分析与检索、人机交互以及机器人等领域中,是目前学术界和工业界研究的

【作者】

：

陈万军

【出处】

：

西安理工大学

【发表日期】

：

2017年01期

【关键词】

：

动作识别深度相机运动分割结构化表示

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人体动作的理解与识别以及运动分割对许多智能系统来说是至关重要的,并广泛的应用于智能视频监控、视频分析与检索、人机交互以及机器人等领域中,是目前学术界和工业界研究的热点问题。目前,基于RGB视频的人体动作识别被广泛的研究并取得了丰硕的成果,但仍然存在着许多挑战问题需要解决,如视角的改变、光照条件的变化、遮挡以及人体姿态的不确定性等。因此,仅依赖于RGB模态中提供的表观与运动信息无法有效刻画人体动作的变化情况。近年来,随着低成本深度相机的发明,尤其是微软公司Kinect的出现,深度相机为直接获取3D数据提供了新的可能。由于深度相机可以同时获得人体动作的RGB与深度(包括3D人体骨骼关节点位置信息)两种模态的数据,更有利于成功的动作识别,因此基于深度相机的动作识别成为当前人体动作识别研究领域中的一个热点。运动分割是计算机视觉研究中的另一个经典问题。在仿射成像模型下,基于跟踪的特征点的运动分割,其本质上是一个子空间聚类问题,每个子空间对应着一类不同的运动。基于子空间的运动分割方法要解决的核心问题是构造具有严格块对角化结构的相似矩阵。本论文针对以上两个问题,研究基于RGB-D深度传感器的动作识别与基于RGB相机的运动分割。其主要工作有以下6个方面:(1)针对深度模态的人体动作数据的特征提取问题,基于骨架关节点与深度映射数据,提出了一种局部曲面几何特征,能够联合描述人体动作的几何表观与姿态信息;通过构造时间金字塔,利用协方差描述子对动作的时间演化信息进行刻画,有效实现了对动作在时-空域上的特征表征。(2)为充分利用RGB模态与深度模态这两种不同特征数据,提取了 RGB模态下梯度直方图、光流直方图和运动边界直方图描述子来有效编码人体动作密集轨迹的运动与表观信息。在此基础上,结合深度模态的特征数据,提出了一种二阶段的多模态融合框架,该框架充分利用了深度模态与视觉模态信息的互补性,综合运用人体运动、视觉与几何表观和轨迹形状信息,实现了 RGB视觉特征级与深度模态级上的多层级融合。(3)为了最大化消除编码系数的类间相关性并同时提升在类别子字典上表示系数的类聚性,提出了一种联合结构化稀疏表示与低维嵌入的字典学习模型,并设计了一种有效的优化求解算法。该模型通过低维投影矩阵的学习来增强字典的表示能力,并进而改进稀疏表示模型的鲁棒性。(4)不同类型特征对不同类别动作的判别能力有着较大的差异,简单的均衡组合这些特征必将削弱具有强判别能力的某些特征,为此提出了一种结构化多视特征学习模型。该模型同时从多视特征的“视-间”和“视-内”来进行特征的融合,筛选出具有判别力的视中所包含的大多数具有强区分力的特征和不具有判别力的视中所蕴含着的具有强区分力的一小部分特征。对于所提出的学习模型,设计了一种迭代优化求解算法并从理论上说明了其收敛性。(5)对于基于子空间聚类的运动分割问题,现有方法中构造的相似矩阵的块对角化结构特征不够明显,文中通过引入局部特征相似性先验信息来引导整个编码过程,提出一种Laplacian结构化表示模型来增强这类方法的性能。在该模型的基础上,设计了一种有效的交替方向乘子法来进行优化求解,并对稀疏子空间聚类和低秩表示这两种方法进行了相应扩展。(6)对于人体动作识别,在6个国际公开并被广泛使用的标准人体动作测试数据集上对以上方法进行了比较深入而系统的实验,取得了较好的实验结果,验证了所提出方法的有效性。对于运动分割,在两个国际公开的标准运动分割测试数据集上进行了实验,较已有的方法在分割精度上获得了较大幅度的提升。

其他文献

VHF/UHF超宽带合成孔径雷达穿透性能分析

穿透性能是VHF/UHF超宽带合成孔径雷达的突出特点,本文定量地分析了其对叶簇、地表的穿透能力,给出了穿透深度与有关参数的数学关系.分析了波长、入射角和极化等主要因素对穿

期刊

超宽带合成孔径雷达穿透性能后向散射

RDX、ITGA5及其信号传导通路在卵巢癌多药耐药中的研究

第一章卵巢癌多药耐药中信号通路关键基因的筛选及其与临床预后的分析目的:综合运用生物信息学方法,结合前期研究结果,筛选与卵巢癌多药耐药相关的信号通路关键基因,并分析其

学位

卵巢癌生物信息学多药耐药靶基因整合素细胞骨架蛋白RDXITGA5顺铂细胞周期信号通路凋亡

土壤光谱反馈面应用于平坦区土壤制图方法研究

土壤是人类生产、生活和赖以生存的重要自然资源。地表土壤类型及属性是土壤科学研究的重要对象。其中土壤类型及属性的空间分布特征是生态过程模拟、水文过程模拟、精细化农

学位

数字土壤制图土壤光谱反馈面土壤光谱土壤蒸散光谱空间地物光谱周期性序列分析

柔嫩艾美耳球虫AMA1与RON2互作的鉴定及其阻断剂的虚拟筛选

鸡球虫病是由艾美耳属球虫寄生于鸡肠上皮细胞内引起的一种以肠道损伤为主要特征的细胞内原虫病。鸡球虫病呈全球性分布,是集约化养鸡场中危害最为严重的寄生虫病,给规模化养

学位

顶膜抗原-1棒状体颈部蛋白-2柔嫩艾美耳球虫蛋白质相互作用虚拟筛选

《史记》叙事范式与民族志书写的本土化

通过司马迁《史记》叙事范式探讨,意在为困扰西方人类学家的一系列问题提供重要启迪,具体包括:以文本而非客观事实为对象的“辨章学术、考镜源流”认识论方式、“述而不作”

期刊

表述危机司马迁民族志叙事本土化

园林植物在城市建设中的配置分析

随着人们对环境意识的加强,建设园林城市成为城市发展的目标。园林植物是园林绿化和园林造景的主要元素,园林植物配置是否得当直接关系到城市园林绿化的品味,而居住小区的植

期刊

居住小区植物配置植物选择园林绿化特色植物

4-6岁儿童数学元认知的发展研究

美国社会认知发展心理学的创立者John Hurley Flavell在对儿童思维过程进行研究的基础上提出了元认知的概念,即元认知(metacognition)是主体对自身认知活动的认知。元认知的

学位

4～6岁儿童数学元认知加、减运算

CHIP蛋白通过VEGF-VEGFR2通路调节肾癌血管生成及其与预后关系的研究

背景:实体肿瘤每增长1-2mm,需要其自身血管的新生以及进一步增殖,这个过程被称为“血管生成”。大量研究显示,在肿瘤发生发展的多步骤过程中,许多信号分子被激活并发生相互作

学位

CHIPVEGFR2血管生成肾癌迁移

IFN-γ调控鼻咽癌PD-L1及NKG2DLs表达研究

目的作为Epstein-Barr病毒(EBV)高度相关的恶性肿瘤,鼻咽癌微环境中存在大量浸润性淋巴细胞及PD-L1高表达。通常认为,PD-L1高表达伴大量CD8~+T细胞浸润的实体瘤患者对PD-1/PD

学位

鼻咽癌PD-1/PD-L1抑制剂NKG2D/NKG2DLULBP3CD8~+T细胞免疫逃逸原发免疫耐药

中国资本市场发展对产业结构调整的影响研究

自改革开放以来,我国经济经历了30多年的高速增长,如今已成为世界第二大经济体,成绩举世瞩目。在我国改革开放刚刚起步的阶段,因为经济基础较为薄弱,市场化机制也不完善,所以

学位

资本市场产业结构调整实证研究

基于结构化表示模型的人体动作识别与运动分割

与本文相关的学术论文