基于深度视觉表示的视频识别算法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户：xincuntianxia

【摘要】

：

近年来,随着计算机视觉应用领域的快速发展,视频识别任务,尤其是对人类行为识别问题的研究成为了目前最火热的研究方向之一。视频识别是视频监控、自动驾驶、虚拟现实等诸多

【作者】

：

乔心舒

【出处】

：

南京理工大学

【发表日期】

：

2004年期

【关键词】

：

视频识别密集轨迹深度学习格拉斯曼流形欧式空间

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着计算机视觉应用领域的快速发展,视频识别任务,尤其是对人类行为识别问题的研究成为了目前最火热的研究方向之一。视频识别是视频监控、自动驾驶、虚拟现实等诸多研究方向的基础任务,因而视频识别任务也受到了学术界和工业界的关注和重视。具体来说,行为识别任务是指对于给定的视频序列,利用模式识别和机器学习算法,自动地分析视频数据,并预测人类行为类别标签。本文在充分调研、总结前人已有工作的基础上发现:目前,大部分的识别算法均基于检测、跟踪或者设计更为鲁棒的特征来编码视频中的动作信息,进而辅助分类,但这类方法没有很好的利用样本类别之间的高层语义信息。针对这一问题,本文提出了基于联合密集轨迹和深度视觉特征表示的视频识别算法(Spatial Temporal Analysis across Grassmannian manifold and Euclidean space,ST-AGE)。ST-AGE 算法设计了一种新的时空特征表示体,通过将该特征体映射到不同的空间中度量样本相似性、分析其高层语义信息,帮助完成视频识别任务。本文工作主要有以下三个部分:(1)本文设计了一个新的视频特征:时空特征表示体(Spatial-Temporal Represen-tation Volume,STRV)。该特征体能够同时表达视频样本空间和时间两方面信息。基于深度卷积神经网络对于建模图像全局结构信息的强大能力,本文选择卷积神经网络中的全连接层的特征表达视频空间结构信息,同时该特征能够保留视频中部分序列方面的信息。另外,为了强化视频特征在时间方面的表达能力,本文选用了基于稠密轨迹的密集采样算法提取视频中显著性区域的轨迹信息。(2)本文提出了使用流形学习方法度量样本之间的相似性或差异性信息。在这一过程中,本文将时空特征表示体拆分为两个部分,将空间特征投影到格拉斯曼流形中计算样本测地线距离,在欧式空间中为每对样本计算时间特征方面的距离。并使用线性融合的方式将编码后的时间、空间特征再次结合在一起,最后使用支持向量机进行分类。(3)为了验证算法的有效性,本文在KTH、HMDB-51、UCF-50、UCF-101四个数据集中进行了验证,同时从多个角度比较了使用不同卷积神经网络结构等多种情况下的结果。实验证明,本文算法在四个大小不同的数据集中均有十分良好的表现。联合密集轨迹和深度视觉特征表示的视频识别算法充分考虑了视频的三维结构特性,并实现了跨空间分析的识别算法,该算法在多个数据集中均达到了较高的识别准确率。

其他文献

动态随机环境下考虑车种代用的铁路空车调配问题模型及算法研究

空车调配问题是我国铁路货物运输生产计划的重要环节,根据路网结构、现有旅客运输计划的安排以及货物车辆的分布情况制定科学合理的空车调配计划能够使运输生产资源的利用情

学位

空车调配车种代用动态时空网络随机环境遗传—模拟退火算法

软配位基重金属吸附材料的制备及性能研究

我国的工业生产在近年得到了快速的发展,但由此带来的污染问题也日益严重。尤其是重金属离子污染严重威胁了饮用水的安全,因而设计对重金属离子具有高亲和能力的吸附剂具有很

学位

软配位基二硫代氨基甲酸秸秆UiO-66-NH2氧化石墨烯

基于网格算法的财务ERP系统的设计与实现

基于网格算法的财务ERP系统完善了企业的财务管理方式,使企业能够获取更多的共享资源,使企业资金的结算更加方便,从而提高企业的运营效率,增强企业在市场中的竞争力。ERP平台

学位

财务管理ERP系统网格算法索引机制

台州抗日救亡运动研究（1931—1945）

1931年九一八事变后,日本占领东三省,中华民族面临了一场前所未有的民族危机;上海一二八事变后,民族危机进一步加深;华北事变后,民族危机大大加深。在此情势下,全国各地抗日救亡运动蓬勃兴起,台州虽远在中国东南一角,战火虽未烧到台州,但台州各界民众并没有置身事外,而是在进步人士的带领下,通过游行示威、宣传教育、文艺演出、义卖募捐、抵制日货等形式进行斗争,从物质上和情感上声援东北、华北及上海等地的抗日救

学位

台州抗日救亡全民抗战国共合作

政府放权与国有上市公司股价崩盘风险

在过去的几十年中,为了提高国有企业的经营效率,国资委和各级政府不断地通过各种方式对国有企业进行放权改革,学术界和实务界对政府放权的经济后果开展了一系列深入的研究。目前关于政府放权相关经济后果研究主要从投资决策、财务业绩、企业价值以及高管薪酬等几个方面展开,现有的文献尚未从股价崩盘风险的视角切入对政府放权的经济后果及其作用机制进行深入的研究。理论上,政府放权的经济后果主要分为“政府干预观”和“代理冲

学位

政府放权股价崩盘风险金字塔层级代理成本

大跨度钢结构连廊施工的技术与经济比较分析

随着高层建筑工程技术的发展,为追求建筑外立面效果和满足使用功能的要求,越来越多的高层建筑带有大跨度连廊。钢结构连廊具有较大的跨度、高度、重量,施工难度较大。在确保

学位

连廊结构施工工况模拟分析成本分析比较分析

不确定需求下两阶段内陆港网络布局研究

2013年我国先后提出建设“新丝绸之路经济带”和“21世纪海上丝绸之路”的重要合作倡议,建立和加强同周边国家和地区的互联互通关系,构建全方位开放合作新格局。随着“一带一

学位

内陆港选址逐渐覆盖碳排放不确定需求鲁棒优化

海藻酸钠复合材料的制备及其对四环素吸附性能研究

20世纪中期,抗生素出现,在这半个世纪的时间中,我们不断探索,抗生素被广泛应用于治疗人体、牲畜等疾病。但由抗生素带来的环境问题日益严峻,而其中由动物通过排泄产生的抗生

学位

海藻酸钠凝胶丝四环素柠檬酸吸附

自由呼吸下基于径向采样的磁共振腹部水脂分离成像

临床磁共振成像往往需要做脂肪抑制来排除脂肪信号的干扰,而在某些应用如腹部成像中,脂肪信号自身又具有诊断价值,因此水脂分离成像一直以来是磁共振成像的一个重要研究方向

学位

磁共振成像腹部成像水脂分离径向采样

丁苯橡胶与天然橡胶共热解气相产物生成机理研究

随着经济的发展,废旧橡胶的产量逐年增加,成为当下的一个重要的环境问题。丁苯橡胶(SBR)与天然橡胶(NR)是使用最为广泛的两种橡胶,针对它们的回收处理是不可忽视的内容。由于

学位

丁苯橡胶天然橡胶共热解气体产物分子动力学模拟

基于深度视觉表示的视频识别算法研究

与本文相关的学术论文