基于视频的人体动作识别方法研究

被引量 : 0次 | 上传用户:saveflv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于视频的人体动作识别是计算机视觉领域的一个热点问题,在智能监控、人机交互以及视频检索等领域具有广泛的应用前景和潜在的经济价值。动作识别的主要任务是通过计算机对传感器采集的原始图像或图像序列数据进行处理和分析,学习并理解其中人的动作和行为,建立底层视觉特征与动作行为类别等高层语义信息之间的对应关系。动作识别中主要解决的问题有两个:动作表示和动作分类。动作表示即从视频中提取有效的特征对动作进行描述,而动作分类则是根据提取的特征设计相应的分类模型。根据对动作的表示的不同,我们将目前的动作识别方法分为三类:基于人体模型的方法,基于全局特征的方法,基于局部特征的方法。其中,基于局部特征的方法是近年来比较流行的方法,在多个人体动作数据集上都取得了很好的结果。视频特征提取与描述是人体动作识别中至关重要的一步,对动作识别的结果有着重要的影响。本文首先对现存的轨迹提取方法进行了详细的分析,指出了它们的创新与不足之处,然后提出了一种新的轨迹提取方法,它能够准确的反映出人的运动信息。为了描述一条给定轨迹的形状和运动信息,我们在它的局部邻域内抽取三种描述符:梯度方向直方图,光流直方图,运动边界直方图。很多情况下,识别人体动作不仅与人体的运动轨迹有关,也与人所处的场景有关,场景信息能够暗示在这种情况下可能会发生的动作类型。基于此,本文使用了一种场景特征Gist来对场景结构进行建模。我们引入了一种词袋模型的思想,将视频表示为一系列视觉单词的集合,由于词袋模型通常忽略了局部特征之间的时空关系,我们将视频序列划分为时空网格以嵌入结构信息。最后,我们还使用了多核学习的思想,将两类特征进行有效的融合,以达到最佳的分类效果。目前的动作识别算法在简单受限的场景下得到了较高的识别率,然而,真实场景(比如电视广播、电影以及监控视频等)中的动作识别仍旧是一个非常有挑战性的问题。为了验证本文算法的有效性和可行性,我们在四个具有挑战性的人体动作数据集上对本文的算法进行了测试和评价。实验结果表明:本文提出的方法能够很好的适应动作实施者的穿着和动作差异等因素的影响,取得了良好的识别效果。
其他文献
目的探讨2型糖尿病患者周围神经病变(DPN)的危险因素及其与心率变异性的关系。方法对149名2型糖尿病患者行常规血生化、肌电图及心率变异性检测,分析2型糖尿病患者周围神经病
林白是九十年代专注于女性主义文学创作的作家之一。到了新世纪后,她的女性主义观念逐渐弱下来,从女性个体走向整个社会。论文以传统女性文化角色为切入点,分为三部分,第一部分从
在全球化的时代背景和中国走和平发展道路的政策指引下,中国地方部门在对外关系中的参与程度也达到了一个新的水平,成为当代中国政治、经济生活中的突出现象。而学科特点造成的
为提高牛粪厌氧发酵的甲烷产量,利用两相厌氧发酵技术研究牛粪酸化处理中的酸化时间、搅拌频率、料液浓度和氮素添加量等条件对产甲烷量的影响。在单因素试验基础上选取酸化时
《三遂平妖传》是中国小说史上第一部长篇神魔小说。它的故事原型来源于北宋仁宗庆历七年发生的王则起义,是以历史事实为基础,结合神话、传说以及前人的话本、笔记小说,整理编撰
2009年3D电影《阿凡达》风靡全球,以其震撼的三维视觉特效、逼真的临场感震撼了观众,改变了人们的观影方式。随着3D电视、3D数字家庭影院逐步走进千家万户,也使得业界有了“
地区经济均衡协调发展要求后发地区实现经济的赶超型、跨越式发展,这是我国经济可持续发展的重要保证。后发地区追赶发达地区实现经济跨越式发展需要寻找到充分的理论依据,以
大豆是重要的油料作物之一,对水分需求敏感,系统的研究水分胁迫历时、灌溉水平对大豆生长发育及产量的影响,对科学合理的设计灌溉,提高大豆产量,节水抗旱具有重要的理论和现实意义
目的观察健脾扶正活血方治疗小儿慢性胃炎肺脾两虚型的临床疗效,为小儿慢性胃炎提供有效、依从性好的临床治疗方案,为健脾扶正活血方的临床应用提供理论依据。方法将60例符合标
林地资源是森林的载体,不仅是土地资源和森林资源最重要的组成部分,更是林业发展过程中最基本的物质基础;林地是增强森林生态、社会经济效益,实现社会繁荣和国民经济可持续发