视频中人的动作分析与理解

来源 :北京理工大学 | 被引量 : 6次 | 上传用户:FSM0225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频中人的动作分析与理解是计算机视觉和模式识别领域的热点问题,广泛应用于智能视频监控、人机交互、视频检索和视频摘要等领域。本文主要研究动作分析与理解中的几个关键问题,包括中层特征的提取表示、长视频中多个动作的联合分割与识别、复杂动作的语义表示和建模、以及动作的识别和定位。本文提出了基于随机森林的中层特征学习框架,在高层语义信息的指导下,融合多种底层特征建立一种具有强判别能力和描述能力的中层特征表示。在基于随机森林的学习框架下,从稠密采样的局部时空块中提取多种底层特征,采用一种新的底层特征融合策略对局部时空块进行分类,将所有时空块的后验概率直方图级联(concatenate)起来构成动作的中层特征表示。本文将时间上下文特征作为描述时空块的底层特征,有效地表示了局部时空块之间的上下文信息。多个动作数据集上的实验表明,该框架中的底层特征融合策略是有效的,能够生成具有强判别能力的中层特征表示。本文研究了长视频中多个动作的联合分割和识别问题,提出了一种带有隐含变量的结构化判别式模型,将包含多个动作的长视频进行分段,同时标注每个视频段的动作类别。在模型中引入一组隐含变量,期望能够挖掘被多个动作共享的、具有判别力和描述能力的潜在语义概念。在基于最大间隔的学习框架下,利用视频段特征、潜在语义概念以及动作类别之间的交互关系表示一个动作,并在动作层面和潜在语义概念层面挖掘不同动作视频段之间的时序上下文关系。对于包含多个动作的测试视频,采用动态规划算法寻找最优的视频分割方式,同时识别每个视频段中的动作。实验表明,该方法能够准确地分割并识别长视频中的多个动作。本文提出了一种基于语义分解的层级描述方法,对于复杂动作视频,从属于“哪种”复杂动作、包含“哪些”原子动作以及原子动作出现在“什么时候”三个方面进行描述。将视频中的复杂动作分解为一组具有单一语义含义的原子动作,提出了一个带有隐含变量的判别式模型来自动检测视频中的复杂动作和原子动作,并分析原子动作的时序结构。提出采用映射矩阵建立视频段与原子动作之间多对一的对应关系,并将其建模为模型中的隐含变量。该方法允许部分训练视频只标注复杂动作类别,采用一种半监督的学习方法自动标注这些视频的原子动作,以减轻训练数据的原子动作标注工作。多个动作数据集上的实验验证了该方法的有效性。最后,本文提出了基于迁移学习的动作识别和定位方法。提出了一种带有隐含变量的知识迁移模型——TLSVM模型(Transfer Latent SVM Model),利用只标注了动作类别的训练视频和少量的网络图像进行动作识别和定位。TLSVM模型将视频中动作发生的位置视为隐含变量,采用一种无监督的方法生成视频中可能包含动作的时空子区域集合,在识别动作类别的同时从候选时空子区域集合中自动搜索动作发生的位置。在模型训练中引入了少量网络图像,将图像中标注的动作位置信息作为一种先验知识,通过约束视频时空子区域和网络图像子区域之间的局部相似性来学习具有强判别力的动作定位模型。由于网络图像和训练视频分别表示为两种不同的异构特征,采用一种基于随机聚类森林的线性变换方法,将图像特征空间映射到视频特征空间。实验表明,通过知识迁移,TLSVM模型能够有效地识别和定位视频中人的动作。
其他文献
图像匹配算法的目标是寻找图像之间的同质区域,进而根据同质区域的映射,建立起图像之间的空间对应关系。它是计算机视觉研究领域中的一个关键问题,也是三维重建、遥感融合、
<正>自动驾驶公司主要的商业模式是运营无人车队。广州南沙自贸区和海珠区生物岛、深圳南山区西丽,每天有约60辆的无人车在这三地奔跑着,它们头顶上顶着一个大大的"车顶盒",
2017年6月17日,“第五届两岸卫生法与生命伦理研讨会暨《基于医学本体特点的医疗立法研究》研讨会”在我校成功举行。本次研讨会由西南医科大学与中国卫生法学会&#183;南方医
指纹是一种具有“人人都有”的普遍性、“每人不同”的可区分性、“一生不变”的稳定性、容易采集等良好特性的生物特征,因此被深入研究并广泛用于身份认证领域。目前,指纹识
从柞蚕遗传学、饮食条件和生物结构、放养条件及后期加工方法系统分析了柞蚕茧丝色泽产生原因,并提出了织绸生产中克服色差的具体方法,文中的理论和试验成果对指导柞蚕及副产
目的探讨低位直肠癌患者外科治疗后肛门功能情况及其影响因素。方法回顾性分析2012年1月1日至2014年12月31日进行经腹括约肌间切除(ISR)术的86例低位直肠癌患者临床资料和随访
氢能以环保和高能被人们所熟知,大规模高效制氢是推动氢经济发展的关键.电解水制氢具备原料广、纯度高等优点,但商业化电解槽分解电压远大于理论分解电压(1.23 V),能耗巨大,而
生物科技将迎来大爆发的十年,博雅以“三级火箭”下注生物经济。
<正>~~
期刊
目的了解睡眠呼吸暂停综合征(sleep apneasyndrome,SAS)患者认知功能损害及各种检测方法的敏感性。方法应用病例对照研究方法,对24例SAS患者和22例健康人进行二音偏倚刺激序列听