人体运动捕获数据的分析与重用研究

来源 :南京理工大学 | 被引量 : 2次 | 上传用户:hanxianzhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体运动捕获数据是一种新型的多媒体数据,在电影、游戏、机器人等领域都得到了广泛的应用。该数据在每一个捕获时间点记录了人体关节的朝向或位置,形成一个运动帧序列。专业的运动捕获设备能够获取高精度的运动数据,在多种应用中逼真地还原出人体运动,给人带来震撼的视觉感受,因而得到了大众的追捧。但是,专业的运动捕获设备的价格十分昂贵,普通用户难以负担,所以运动捕获一般只有大型的公司或者研究机构才能完成,无法得到普及。运动重用技术能够利用已有的运动数据,通过分析和建模生成满足用户需求的新数据,有效降低了使用运动捕获数据的时间、金钱和人力成本,因而受到了广泛的关注,已经成为了一项十分热门的研究课题。  运动重用的研究包含了一系列相关技术,如运动分割、运动恢复、运动去噪、运动压缩、运动检索、关键帧提取和运动合成。早期的相关方法多是从运动学和图形学角度进行研究,缺乏对运动数据特性的有效建模,后来也出现了一些基于机器学习方法的运动重用技术,但这些模型多是将一些经典的机器学习算法直接用在了运动数据上,效果并不是很理想,因此本学位论文从机器学习的角度,针对运动分割、运动恢复、关键帧提取和运动合成任务分析运动捕获数据的一些重要特性,设计了一些适用于运动捕获数据的定制型的机器学习算法。本学位论文的主要工作和创新性成果如下:  (1)提出了一种鲁棒的时序稀疏子空间聚类算法,解决了含非高斯噪声的运动捕获数据的分割问题。在稀疏子空间聚类的框架下,使用测地线指数核对运动捕获数据的黎曼流形结构进行建模;用相关熵代替原本的二阶统计量进行误差度量;用三角约束阻断相距较远的运动帧之间的联系,从而保证了分割结果的时序连续性;用多视图重构提取了关节间的关系信息,并将其用于最终的分割。因此,由于对运动数据的一些特性有效的建模,使得提出的模型不仅能够完成时序分割任务,还能抑制运动捕获过程中产生的非高斯噪声。此外,由于三角约束的引入,将传统的稀疏子空间聚类模型的二次复杂度降为了线性。  (2)提出了两种基于稀疏性的运动恢复模型,分别利用运动数据的稀疏和低秩特性完成运动恢复任务。首先,在稀疏表示的框架下,将运动恢复的过程加入到字典学习算法中,即求取不完整运动帧的稀疏表示系数,再用该系数更新完整的字典,使得学习得到的字典在理论上更适合运动恢复。接着,为解决上述方法out-of-sample的问题,提出了一种非线性的低秩矩阵恢复模型。在该模型中,通过多核学习寻找运动捕获数据的特征空间,在其特征空间中,运动数据是线性的并且具有天然的低秩性,从而可以使用低秩恢复对丢失的关节进行恢复。此外,引入运动学约束不仅保证了恢复运动的运动学特性,还可以作为运动恢复的先验知识,有效地压缩优化算法的搜索空间。  (3)提出了一种联合核稀疏表示模型,有效地利用运动捕获数据的稀疏特性进行关键帧提取。在该模型中,利用测地线指数核将运动数据投影到希尔伯特空间,假设运动数据在希尔伯特空间中是线性的,以运动本身作为字典,便可以对运动数据进行稀疏表示。用Lp,2(0<p<1)范数代替L1,2范数,以解决传统稀疏表示模型提取的关键帧冗余的问题。为每个关节分配一个单独的重构系数矩阵并进行联合的稀疏表示,使得重构系数矩阵能够获得嵌入在运动中的更为细节的信息。此外,三角约束的使用使得在优化的过程中每个运动帧都只能被其一定范围内的相邻帧表示,有效解决了周期性运动关键帧分布不合理的问题。  (4)提出一种模板化的运动合成模型,简化了运动合成方法的控制方式,提高了运动合成过程的可理解性。利用稀疏主成分分析(Sparse principal component analysis,SPCA)、Group lasso和Exclusive group lasso对人体运动进行建模,学习得到一组低维参数,分别控制着人体运动的一个内在自由度,并具有直观语义;同时,每个关节被尽量少的低维参数所控制,以减少低维参数对彼此所控制的自由度的交叉影响。通过直观地修改低维参数,就能够实时地控制每个参数对应的摆臂幅度、踢腿高度、跳跃距离等运动属性。这种“模板学习、模板定制”的两步方法,有效地降低了运动合成控制的复杂度和运动合成技术的应用门槛。
其他文献
在实际工程中,大部分的系统是非线性的,自适应控制方法作为解决非线性系统稳定性问题的主要方法之一得到了广泛研究。在现代控制中,大部分的控制器是通过计算机传输到系统中的,而
随着航迹规划技术在军事及航空、航天领域得到广泛的应用,越来越多的研究者开始围绕这一领域展开研究,并提出了多种航迹规划算法,以满足不同飞行约束条件下航迹规划问题的需求。
显著性检测是计算机视觉领域中的热点问题之一,其目的是令计算机具备人类视觉处理信息的能力,使其能够自动找到图像中吸引视觉注意力的区域。经过近二十年的发展,视觉显著性技术
随着社会的不断发展以及城市化进程的加快,城市道路交通的拥堵成为当前世界各国普遍面临的问题之一。为了实现交通管理的最优化,近年来对智能交通系统的研究成为国内外的一个
齿轮箱是机械设备的重要组成部分,对齿轮箱进行故障诊断具有重大意义。基于DSP的嵌入式故障诊断系统是以数字信号处理器为核心,把信号采集,数据处理,数据存储及故障识别功能集于一体的系统。本文采用基于模型的设计,以齿轮箱为研究对象,剖析齿轮箱振动信号特点,使用TI公司TMS320F28335数字信号处理芯片为核心及外围器件搭建硬件电路,软件采用MATLAB中的Embedded Coder,Simulin
在能源危机和环境污染日益严重的今天,迫切需要采取措施加大可再生能源的开发利用程度和开发技术水平。风力发电和太阳能发电作为重要的可再生能源,如何有效的加以利用,努力提高其在能源结构中的比例,为国家能源结构调整和地球环境保护做出巨大贡献,成为当今社会及以后发展的重要课题。因此,本文将以提高能源利用效率为目标,对小型独立式风光互补发电系统及其控制策略进行研究,为其实际应用提供参考。本文分析了风光互补发电
PID控制从诞生以来一直是工业过程控制中应用最为广泛的算法。由于它的结构比较简单,易于实现,而且具有鲁棒性强的优点,所以过程控制人员对其青睐有加。随着工业过程越来越复杂,
本文论述了基于DSP+FPGA的转台控制系统设计开发过程,并对设计中的关键技术进行了探讨。论文首先介绍了雷达转台伺服系统的性能要求,估算了系统负载,分析了系统的结构。然后,制定
随着全世界范围内能源危机和环境污染的问题日益突出,可再生能源的利用越来越得到人们的重视,其中,太阳能作为一种新型的绿色可再生能源,具有存储量大、清洁环保无污染等优点。对于太阳能的利用最重要的技术就是光伏(Photovoltaic, PV)发电技术,从上世纪80年代中期开始研究和使用光伏发电系统,到如今已经形成多种结构的发电系统。各种结构的使用方法不同,发展趋势也各不相同。如多支路式结构、串型结构和
随着风力发电规模的增大,风电的集中接入所引起的较大功率波动将对电网带来较大的冲击,严重时影响到接入电网的安全与稳定运行。准确预测风速可有效减少这种不利影响,已成为风力发电领域研究的热点和难点。本文以风速为研究对象,通过分析短时风速时间序列的时间相关性、非平稳性、非线性和混沌特性,给出了基于小波过程神经网络的短期风速预测模型,重点研究了具有过程神经元的空间加权聚合运算、小波的时间分解累积运算的风速预