基于视觉的人体姿态与手势描述及其识别

来源 :苏州大学 | 被引量 : 0次 | 上传用户:haosy2966
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态识别是计算机视觉领域中的重要课题之一,有助于实现高效的人机交互,备受研究人员关注。手势是人体姿态的重要细节,往往被单独研究。在人体姿态与手势的识别中,对其进行有效描述尤为重要。本文基于人体姿态与手势的视觉信息,研究了一系列的人体动态运动描述方法、静态姿势描述方法、手部分割方法、三维手势描述方法、人体姿态与手势的识别方法,以及它们的现实意义和应用价值。本文首先提出了一种基于深度信息的手部分割方法,该方法通过设置自适应的深度阈值,寻找合适的轮廓拐点,能够从深度图中精确地分割出手部区域。同时,基于Kinect传感器搭建了一个人体姿态及手势信息实时获取平台,该平台能够实时显示和保存彩色图像、深度图像、人体骨架以及分割后的手部图像,给后续人体姿态与手势描述及其识别的相关研究提供了良好的数据支持。为了获得能够表达运动特征的一般性描述,本文提出了一种基于运动基元的人体姿态描述及动作识别方法。该方法通过计算每个骨骼关节点在相邻帧间的运动来表示其三维运动轨迹,提取低级特征以提高算法效率,同时避免了运动信息损失。对低级特征进行聚类得到运动基元,以直方图形式对其进行量化。此外,计算关键骨骼点间距离得到直方图来表示静态姿势,形成对运动基元直方图的良好补充,两者组合构成最终的人体姿态描述子,通过随机森林算法实现动作识别。实验结果验证了该人体姿态描述子具有对运动速度的不变性,以此为基础的动作识别方法在各个基准人体动作数据集上也取得了优异的识别准确率。本文针对硬聚类方法的局限性,提出了一种软量化学习的方法,用于量化和表示人体姿态的特征。提出了一种时空多尺度软量化网络,这是一种使用RBF神经元的可训练的软量化方法。在不同的空间等级下,包括整个人体姿势级别、身体部位级别、各个骨骼关节点级别,使用不同的RBF神经元组,级别内部的各组RBF神经元是不共享的。为了捕获人体姿态的时间信息,在不同的时间尺度上对动作特征序列进行量化,不同时间尺度上的RBF神经元组是共享的。该时空多尺度软量化网络是端到端的神经网络,能够被样本标签有效监督,通过反向传播和梯度下降方法训练,实现动作识别。实验结果验证了软量化方法的有效性,说明了时空多尺度思想对于人体姿态描述是有意义的。最后,本文单独研究了手势的描述与识别,提出了一种3D手势描述及其识别方法。该方法在多个尺度下充分利用了 3D手势的局部和全局特征,在显著特征点处提取手势的3D深度上下文信息作为3D手势描述子。为了更好地衡量不同手势间3D深度上下文描述子的相似性,本文改进了 DTW算法,使用卡方系数计算两个描述子间的距离。该描述子对于手势的几何变换和非线性形变是不变的,并且对于噪声和杂乱的背景也是鲁棒的。以此为基础的手势识别方法在各个基准手势数据集上都取得了优异的识别准确率,并且算法效率能够满足实时应用的要求。
其他文献
随着经济全球化的发展,我国逐渐融入世界经济浪潮中去。在国际化进程中,我国积极探索适合本土公司的发展模式,资本市场的各项制度与发达国家经济体逐渐趋同。尽管社会责任作为国家资本市场制度的重要组成部分,但是,近年来我国社会责任的状况不容乐观,社会责任发展依然面临严峻的挑战,从最初的“瘦肉精,毒奶粉”事件到现如今长生生物“假疫苗”,“两康药业”财务舞弊,社会责任的恶性事件确实渗透在资本市场各个方面,社会责
红曲菌(Monascus spp.)属于食品发酵微生物,其发酵产品红曲,在我国有近2000年的应用历史。红曲色素(Monascus pigments,MPs)是红曲菌产生的天然色素,主要用做食品着色剂。由
作为机器人领域应用最为广泛的基础平台,Robot Operating System(机器人操作系统,以下简称ROS)为用户提供了大量开发工具,使开发者可以方便地进行机器人研发。在自主导航方面,ROS提供了自主导航所需要的底层算法,满足了基本的导航需求。但由于ROS提供的导航模块主要针对圆形机器人设计,没有充分考虑机械机构的不同对导航性能的影响,导致部分功能在应用于常见的前轮驱动等结构的机器人时效果
黄曲霉毒素 B1(Aflatoxin B1,AFB1)是一类由寄生曲霉(Aspergillusparasiticus,Aparasiticus)和产毒黄曲霉(Aspergillus flavus,A.flavus)等产生的有毒次级代谢产物,具有较强
为明确川西地区中二叠统栖霞组优质储层特征,论文以四川盆地西部晚古生代中二叠统栖霞组海相碳酸盐岩地层为研究对象,以碳酸盐沉积学及储层地质学理论为指导,采用多学科、多
为了通信安全,监管部门需要对信号进行监听和分析。监听情况下是不知道通信参数的,就需要对信号进行盲识别。信号的识别主要包括载波估计和调制识别,其中调制方式的识别是最基础也是最重要的。短波数传信道存在信号的衰落、多径效应、多普勒频移等特性,信号通过通过短波数传信道后,难以直接识别出来。因此本文研究了短波数传信道环境下如何有效的对数字调制方式进行识别。本文首先研究了短波数传信道,搭建了短波信道模型,实验
虽然汽车经过多年的发展和普及,但是汽车的操纵稳定性和乘坐舒适性依然是车辆设计的重点。悬架系统是决定车辆稳定性和乘坐舒适性的关键因素。获得良好的悬架性能需要解决两
膜分离技术是一种以分离膜为核心,对物质进行分离、浓缩和提纯的一门新兴技术,是一种经济、环保、高效的分离手段。目前,聚偏氟乙烯(PVDF)由于化学稳定性好、机械强度大、成
沸石分子筛的晶粒尺寸是一个十分重要的性能参数。与常规粒度分子筛相比,小晶粒沸石分子筛意味着更大的外表面积和更多的外表面活性中心,以及短而规整的孔道,有利于产物的扩
火不仅改变了人类的历史,革新了人类新的工具与技术,还改变了人类的进化。火是一把双刃剑,它在让我们享受生活与感受文明的同时,也让我们备受其害,给人类的生命、财产、安全等方面造成了严重的损失。在火灾事故中,建筑火灾事故发生的概率日益升高。自2008年汶川发生特大型地震后,隔震建筑在地震中的显现出优异的抗震性能,使得隔震结构越来越受到人们的重视,也使得隔震结构在医院、学校、车站等重大工程中大量使用,也增