基于时空特征提取的视频动作识别技术研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:zhaolong0804
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频动作识别通常是指从一段视频序列中识别出人体动作类别的过程,该项技术广泛应用于多媒体内容分析、人机交互、智能实时监控等领域,可以通过对视频进行特征提取生成特征向量,用分类器对特征向量进行分类来实现。本文主要针对视频的时空特征提取问题展开研究,传统方法中通常将视频三维时空域作为一个整体来捕捉视频动态变化特征,这种做法存在片面性,会导致丢失大量属于二维图像空间域或一维时序域特有的变化特性,因此,视频动作识别技术需要对视频时间、空间结构分开处理以便更加全面地捕捉视频动态变化中的时空特征信息,本文针对以上问题提出了两种视频时空特征提取算法,主要研究内容如下:1)本文提出了一种基于多通道时空金字塔的视频时空特征提取方法。该方法的核心内容是多通道时空金字塔模型的构建,该模型摒弃了传统时空金字塔将视频三维时空域整体多尺度子分割的方式,而对视频分别进行三维时空域、二维图像空间域、一维时间域三个通道单独进行多尺度分割,结合词袋模型计算每个子空间词频直方图,最后串联所有子空间词频直方图作为视频最终特征向量,用分类器对特征向量进行分类。该方法可以更加全面的捕捉视频分别在三维时空域、二维图像空间域、一维时间域上的特有的动态变化特征,丰富了视频特征的时空结构信息。2)本文提出了一种基于排序池化融合空间特征的视频时空特征提取方法。该方法对视频每帧图像的二维空间域进行多尺度分割,单独对每个子空间内按照时序排列的局部特征向量序列用排序函数进行监督学习,捕捉子空间特征序列的时序变化信息,将模型参数作为该子空间的特征描述子,最后串联各个子空间描述子获得视频最终特征向量,使用分类器对特征向量进行分类。该方法将二维图像空间特征融入排序池化算法中,既继承了排序池化算法可以捕捉丰富的视频时序变化特征的优点,又弥补了其缺乏二维图像空间结构特征的缺点,可以有效地提高动作识别的准确性。
其他文献
《党报经济新闻怎样找到“平衡感”——兼论对经济新闻专业性的理解和把握》获得中国新闻奖新闻论文二等奖,体现了中国新闻奖对新闻论文参评作品重视理论联系实际、重视实践
以桂林五台旅游演艺产品为研究对象,以携程网站上的游客点评为文本资料来源,结合内容分析法和扎根理论,对其中的游客感知要素进行提取及要素评价等级进行评定,同时运用ROST软
朋辈心理辅导作为心理健康教育的一种特殊形式,在大学生心理健康教育工作中特别是在大学生心理危机干预工作中发挥着越来越重要的作用.文章从朋辈心理辅导的起源、内涵及特点进
2018年山西省开展了《主要树种(油松)根径立木材积表编制》试点工作,以满足林业生产应用对根径材积表的需求。其主要目的是填补山西省无"根径立木材积表"的空白;扩编山西省主
随着科学技术的进步和市场经济的发展,包装已成为现代市场经营中的一项专门学问,是现代产品经营策略中十分重要的组成部分。目前,商品种子已向商品化、社会化、标准化方向发展,为
<正>面瘫,是中医俗语,俗称口眼歪斜。西医称之为面神经麻痹。中医认为本病是由于脉络空虚,外感风寒之邪,侵袭面部阳明、少阳脉络,凝滞于脉络所致;西医认为是感冒病毒侵害面神
会议
在统计分析顶板巷瓦斯抽采在国内使用情况的基础上,为了协调顶板巷瓦斯抽采与煤自燃的关系,立足解决顶板巷瓦斯抽采诱导煤自燃问题,以耿村矿为例,通过顶板巷气体成分及采空区
基于能合理反映中间主应力效应的统一强度理论,推导出适用于筒仓侧压力计算的统一侧压力系数,并分别将其应用于深仓和浅仓的侧压力计算中,将理论推导结果与既有试验结果、中
目的探讨D-二聚体在评估非小细胞肺癌(NSCLC)转移及预后中的临床应用价值。方法收集2012至2015年确诊的NSCLC患者236例、健康人对照组58例和肺部良性病变组50例,并按照临床分期
城市地下综合管廊在建成后,会因为各种原因产生渗漏水,严重影响管廊内设备、管线、电缆的安全使用,采用堵、排、防、抗相结合,刚柔相济、因地制宜的原则,用综合整治的方法来