面向未剪辑视频行为识别的关键信息提取与建模研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:Kdx1999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频行为识别任务是对视频中人物所做动作进行识别和分类的一项技术,在日常生活的公共安全和危险预警等场景中有着重要的应用,并且在人际交互、智能标注等诸多领域也有着迫切的需求。目前,视频行为识别任务仍具有挑战性,尤其是在面对现实生活中未经剪辑的视频时,效果表现并不理想。主要原因是对于未剪辑视频来说,1、视频内容过于冗长;2、人物行为太过复杂;3、不同视频源的时长和分辨率不一致。因此,为了能让视频行为识别在现实生活中有着更好的应用,本文对上述问题进行了深入研究。针对视频内容冗长问题,本文提出了一个视频关键运动信息提取算法(Video Key-motion Information Extraction,VKIE)。该算法分为两步,第一步是利用视频光流的频谱信号来筛选视频的运动帧。视频中的运动变化可以反应在视频光流矩阵上,因此不同运动状态的视频帧其光流矩阵数值变化不同,那么转换到频域上的的频谱信号数值也有差距。于是基于这种差距,利用高通滤波和阈值分割思想将视频中不包含运动信息的非运动帧去除,保留其中的运动帧。接着根据不同运动状态所呈现的光流数据的分布差异,利用局部密度聚类算法(Density Peaks Clustering,DPC)来对运动帧的光流进行聚类,以此进一步挑选出其中的主要目标人物运动帧。这些视频帧便是视频的关键运动帧,其中包含了视频的关键运动信息。针对人物行为太过复杂问题,本文提出了一个视频运动信息长期时间依赖关系网络(Long-term Relationship Modeling Network,LRMN)。LRMN在时间关系网络(Temporal Relation Network,TRN)的基础框架上,利用(2+1)D卷积对其进行重构。该网络首先对输入的序列数据进行分组,并利用2D卷积的来提取多组段级特征。接着再将段级特征堆叠,并用1D卷积对堆叠特征的每个像素进行时序建模,得到整体视频级特征。这种方式可以同时进行时间和空间维度的建模且互不影响,并适用于长段序列数据的时序关系建模。针对不同视频源的时长和分辨率不一致问题,本文提出了一个视频多尺度时空金字塔层级特征融合算法(Multiscale Spatiotemporal Pyramid-level Feature Fusion,MSPFF)。该算法利用了特征金字塔(Feature Pyramid Network,FPN)的思想,对输入的视频数据提取多尺度时间和空间特征。并提出一种多尺度时空特征交互融合策略(Multiscale Spatiotemporal Feature Interactive Fusion,MSFIF),对这些多尺度时间和空间特征进行融合并构建时空特征金字塔,以此适应不同时空尺度的视频输入。最终将三个算法模块进行结合,并在多个经典数据集上展开了实验。实验结果表明,本文提出的方法可以很好地捕捉到视频中的关键运动部分,并以此进行多尺度时间和空间特征建模与融合,使得视频中的时序信息与运动空间场景产生联系,得到鲁棒的整体视频表征,提高识别的准确性。
其他文献
报纸
<正> 最近,许多学者提出,低能冷激光(CLs)是促进伤口愈合的有效辅助治疗方法。两年来,我们在AMI—Plaza医院物理治疗科联合应用红外CL与传统的消毒旋流水浴治疗开放性伤口并观察了治愈结果,目的是通过这两例来讨论治疗方案。治疗方案:治疗前需观测伤口的大小、颜色、分
期刊
不同语言文化背景的人们在进行交际的过程中,常常会产生各种各样的误会,并造成交际的失败,为了厘清这些误会,我们有必要对产生这些误会的文化习俗、社会生活的方方面面进行细致的探讨,以减少人们交际过程的摩擦。本文将深入探讨造成跨文化交际失败的其中一个方面——中西幽默观的差异,这里的西方以英美国家为主。有人认为,幽默观的差异不会造成跨文化交际的失败,但事实正好相反,如果两个不同语言文化背景的人幽默得不恰当,
现如今,在新课程改革的大背景下,使教师的教学模式发生翻天覆地的变化,同时也丰富了教师的教学方式。而在课堂教学实践中有效应用小组合作学习的方式是现阶段课堂学习的常见方式。小组合作学习方式不但会促进学生思维多元化,还有利于提高学生的集体意识、团结意识和合作共赢意识。基于此,本文主要探讨班级小组合作学习在初中数学高效课堂中的应用策略。
初中英语教学需要注重学习者视角,以学生为主体,带动学生的英语学习参与热情,提高教学质量。在教学中,教师应当打破传统教学局限,在阅读教学当中,利用主题阅读、互动阅读等教学策略,帮助学生建立英语文化感知、强化对于英语表达方式的理解,使学生对于英语语言的认知更加全面,进而使学生的英语能力得到提升。
地热发电是有效减少CO2排放的可再生能源利用手段。文章根据日本能源协会以及经济产业省资源能源厅等相关文献资料,从物质能源流角度分析地热能源发电的现状、技术革新动向。结果表明,当前碳中和大背景下可再生能源利用逐步得到重视,地热发电的各种规章制度执行得到保证,从成熟的水汽循环地热发电系统,向低温温泉双循环、深部干热岩层、二氧化碳循环等地热发电技术层面创新。
在小学英语教学中,课内外阅读相辅相成,缺一不可,在提高学生英语素养中起着关键作用。文章提出了小学英语课内外阅读有效融合的策略,目的在于提高学生的阅读能力。
以CO2为工质的增强型地热发电系统(CO2-EGS)拓展了CO2封存汇的种类,同时其从干热岩中获得的热量还可补充因捕集、输运和封存消耗的能量,有效提高了项目的经济性。但多大程度上可填补CO2捕集及输运的能耗是该技术规模化应用与发展过程中亟需解决的关键问题之一。为此,通过对CO2捕集电站与地热发电全链系统的解构和耦合,在降低了全链系统某些参数的敏感性基础上,编制了全链优化软件。然后以某超临界燃煤电站