视频中人体姿态估计、跟踪与行为识别研究

来源 :山东大学 | 被引量 : 0次 | 上传用户：martelfeng

【摘要】

：

随着机器人越来越多地参与到人类日常的生产与生活,人机交互问题引起了广泛的关注。在人机交互问题中,机器人感知外界环境的能力非常重要。与人类感知外界环境类似,机器人也

【作者】

：

马淼

【出处】

：

山东大学

【发表日期】

：

2017年期

【关键词】

：

人体模型人体姿态估计行为识别视频理解

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着机器人越来越多地参与到人类日常的生产与生活,人机交互问题引起了广泛的关注。在人机交互问题中,机器人感知外界环境的能力非常重要。与人类感知外界环境类似,机器人也需要通过视觉、味觉、嗅觉、听觉与触觉来感知外界环境信息。在目前机器人的应用场合中,较为常用的机器人感知方式是视觉、听觉与触觉。其中视觉尤为重要,人类获取信息的80%来自于视觉,因此学术界对机器人通过视觉获取信息的方法与技术的研究关注度最高。用于人机交互场景中的机器人通常依靠彩色摄像头感知与观察人体及其外界环境。本论文通过从视频中提取的信息来识别并理解人体的行为与动作等,可以快速建立人体行为特征数据库,为仿人机器人行为规划或人机交互提供基础数据和模型支持。本文提出了基于多级动态算法结构的人体姿态离线估计方法和全局-局部分层的人体姿态在线估计与跟踪方法;并在视频中人体姿态估计结果的基础上,提出了基于关键帧切割视频子段的人体运动行为识别方法和基于卷积神经网络特征编码的人体精细行为识别方法。论文的主要内容及创新点如下:1.构造出可分解与重构的二维人体姿态表达模型。该模型由全局层和局部层组成,称为全局-局部分层的人体姿态表达模型。模型的全局层用来表示完整的人体上半身姿态,局部层用来表示每个人体部位的独立姿态。此模型的优点是,在进行人体姿态的优化时,可以在局部层中对部位姿态进行单独的优化,并用最优的局部层部位姿态逼近最优全局层姿态;对于局部层得到的姿态结果,又可以通过全局层进行修正,从而使人体姿态优化问题更具有针对性。2.给出了实现视频中人体姿态离线估计的多级动态算法结构。该算法分为五级,在人体姿态估计的过程中,每一级的参数及数据动态变化,称为多级动态算法结构。在视频相邻帧中建立虚拟姿态,并利用虚拟姿态计算姿态样本在视频中的一致性损耗,构造评价姿态候选样本的代价函数,从而保证了视频序列中人体姿态的一致性。另外,通过对粒子群优化算法的有效使用,实现了用较少的人体姿态候选样本逼近最优人体姿态,在得到视频中精度较高的人体姿态估计结果的同时减少运算量。3.提出了全局-局部分层的视频中人体姿态在线估计与跟踪算法。首先,在视频第一帧中对人体姿态目标进行初始化,得到视频中目标人体的有效信息。其次,在人体姿态估计与跟踪的过程中,利用视频运动信息与图像表观信息,对目标进行边跟踪边校正。然后,构造一种惩罚发生漂移或误估计姿态的自适应惩罚函数,保证人体姿态在视频中的连续性,有效实现了视频中人体姿态的在线估计与跟踪。4.提出了基于多图像序列及视频切割技术的视频中人体运动行为识别方法。首先,采用人体姿态估计方法得到人体关键点在图像中的位置,从图像中提取出人体区域的图像块,增加了人体行为信息的有效像素。其次,计算光流图及其对应的人体区域图像块,共构造出四条图像序列,并用卷积神经网络进行处理。然后,提取视频序列中关键帧并构建二叉树对视频进行切割,得到了由粗略到精细的数个视频子段。最后,从每个视频子段中提取卷积神经网络特征向量并融合,构造出能够表达人体运动行为的特征,实现了视频中人体运动行为的有效识别。5.提出了基于行为细节信息的视频中人体精细行为识别方法。首先,给出一种基于人体关键点位置信息提取人体精细行为操作区域的方法,增加了视频中精细行为的有效像素。然后,利用卷积神经网络处理图像序列中的图像块,并对最后一个降采样层的输出特征进行编码,构造出能够区分不同人体精细行为的视频描述子,实现了视频中人体精细行为的有效识别。

其他文献

MG53蛋白的研究进展

近年来研究发现,Mitsugumin53（MG53）蛋白是存在于心肌和骨骼肌中的一个新靶点,作为Tripartite motif-containing（TRIM）的家族成员之一,它被认为通过作用于伤口加快组织修复。MG53

期刊

Mitsugumin53心肌细胞修复胰岛素信号通路TRIM72

视觉分析中的层次化结构关联特性研究

通过对大样本数据进行有效的表征、学习和推理,实现对图像、视频等在内的多媒体信息的自动理解是计算机视觉的主要研究内容之一。不同的视觉分析处理过程具有天然的层次特性

学位

结构化分析先验知识结构约束计算机视觉机器学习

九位数可开尽立方根的快速心算

2003年3月22日，河北电视台卫星频道播出了《发明空间》栏目第17期。在那期节目里笔者表演了心算√200'617'094'819=8539。朋友们问道：“怎么算得那么快?”应当说，这

期刊

九位数立方根心算方法三位分节运算口诀

轨道板与砂浆粘结试验及内聚力模型参数研究

研究目的:目前轨道板与CA砂浆层离缝损伤是我国CRTSⅡ型板式无砟轨道主要损伤形式,本文为研究砂浆层离缝损伤机理,制作混凝土和砂浆复合试件进行劈拉和剪切模型试验,采用数字

期刊

无砟轨道层间粘结数字图像相关技术内聚力模型

中小学生课堂问题行为研究述评

学生的课堂问题行为是中小学教师在课堂管理中迫切需要解决的问题。通过对近20年来国内外研究进行梳理分析,发现学生的课堂问题行为具有普遍性。教师和学生知觉到的问题行为

期刊

课堂问题行为表现类型影响因素启示

视频压缩中的高效帧间编码技术研究

近年来高清及超高清视频不断出现,使得以H.264/AVC和AVS为代表的第二代视频编码标准已无法满足实际应用的需要。为了提高编码效率,国际JCT-VC工作组于2013年完成新一代视频编

学位

视频编码3D视频编码帧间预测维纳滤波变形块的运动信息获取快速纹理编码

无精子症患者精液常规、精浆生化与生精细胞检测及其临床价值

目的:探讨无精子症患者精液常规、精浆生化与生精细胞检测在无精子症鉴别诊断中的价值。方法:通过改良巴氏染色法分析70例无精子症患者精液中的生精细胞,根据精液中生精细胞

期刊

男性不育症无精子症生精细胞精浆生化精液常规

人脸识别中若干特征优化方法研究

随着信息技术的快速发展,生物特征识别技术正在被大范围地应用到金融、安防等领域并受到了社会各界的广泛认可。与其它生物特征识别技术相比,人脸识别技术具有友好、直观、可

学位

人脸识别滤波器学习特征提取特征选择稀疏表示自表示模型

精索静脉曲张不育症患者精浆生化标志物与精子顶体酶的测定与分析

目的探讨精索静脉曲张(VC)不育症与精浆生化标志物及精子顶体酶的关系,为精索静脉曲张不育症的发病机制提供实验依据。方法患者来源于2012年5月~2013年5月广东省中医院珠海医

期刊

精索静脉曲张不育症α-糖苷酶活性锌弹性硬蛋白酶酸性磷酸酶精子顶体酶

面向社会舆情事件的人工社会建模与仿真研究

近年来,随着我国经济社会发展进入转型期,各种体制性和结构性矛盾日益突出,社会群体间的利益分化与冲突日益加剧,由舆情的传播演化和情绪集聚引发的群体性事件呈上升趋势。因

学位

社会舆情人工社会信息传播意见交互社会关系日常活动元建模框架仿真实验

视频中人体姿态估计、跟踪与行为识别研究

与本文相关的学术论文