面向视频数据的行为智能分类关键技术研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:agreessive
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面向视频数据的行为智能分类研究因其具有重要意义和应用价值,目前已经逐渐成为学术界与产业界的研究重点。该研究不仅苛求于算法模型能够挖掘视频中完备的空间特征,亦需对时间信息进行有效表达。尤其是在时间建模方面,近年来的算法研究多数通过引入时间差分操作来提取相邻帧之间的运动信息,并使用相加融合或注意力融合的方式将其融入到原始特征当中,取得了一定效果。然而,通过分析,时间差分操作以及对运动信息无差别对待的方式易于使时间特征受到负面影响,从而导致最终效果受限。有鉴于此,本研究提出了一种基于运动增强与特征融合的新算法,贡献如下:(1)针对现有时间差分操作导致的非完整运动轮廓提取缺陷,设计了一种运动累加模块(Motion Accumulation Module,MAM),一定程度上解决了差分算法关键信息提取不完整的潜在问题。具体而言,通过特征级别的时间累加操作来获取更为广泛的空间运动信息,以期在提取到视频帧蕴含的有效运动信息同时,可以保持所提取运动目标的轮廓完整性。(2)考虑到现有算法多采用“平等”融合方式,即将所提取运动特征均以相同的贡献参与分类,因而识别效果受限。为此,设计了一种运动选择模块(Motion Selection Module,MSM),使模型在训练过程中能够通过自主学习的方式获得不同运动部分的融合权重,最终将所提取的运动信息选择性地融合到原始特征当中,以确保所融合的运动信息对模型的识别有效且是正激励的。(3)作为整体思考,上述改进后的模块统一到(2+1)D卷积网络结构中,构建了最终的运动累加和选择网络(Motion Accumulation and Selection Network,MASNet)。经消融实验与实际验证,本研究所提出的MAS-Net模型在SomethingSomething V1和Something-Something V2两个与时间相关的行为识别数据集上均取得目前最先进的成绩(55.4%及66.7%),且计算量保持在较低的水平;同时,在与场景相关的Kinetics-400数据集上也达到了极有竞争力的水平(76.3%)。因而,本研究成果可以有效支撑视频中的行为智能分类应用要求。
其他文献
<正>随着复习备考的深入推进,研究高考命题技巧和解题策略显得尤为重要。一方面,可以帮助教师更加精准地把握考点,提高复习备考的针对性。另一面,可以帮助考生掌握解题方法和思路,提高解题的速度和准确度。本文拟分析七选五阅读理解的命题特点,探索高效的解题策略。
期刊
计算固-液界面之间的润湿角对表征界面相互作用及分析材料特性具有重要意义。随着计算机科学及图像处理技术的不断发展,润湿角的测量从传统的人工观察测量逐渐演变成基于计算机视觉的测量,并且自动化程度相比过去有了很大的提升,使得操作者的劳动量大大减少。近年来,利用图像方法测量润湿角已经取得了不小的进展,国内外也出现了许多成熟的技术和设备,可用来测量常温下液滴与界面的润湿角,分析其对界面的润湿效果。在测量高温
学位
由于可见光通信(Visible Light Communication,VLC)可弥补频谱资源不足的问题,并且可同时完成照明与通信的需求,其已成为国内外研究的热点。目前VLC的点对点通信技术已趋于成熟,并已取得了可观的成果。为了满足室内网络中用户对于高数据量传输的需求,提出将VLC这一支持高速率的通信技术运用到组网技术当中,以此作为缓解室内网络压力的解决方案。对于还处于研究初级阶段的VLC组网系统
学位
地基合成孔径雷达(Synthetic Aperture Radar,SAR)作为一种高精度测量技术,具有全天候、非接触式和设站灵活等优点,能够实时监测场景的形变情况和变形趋势,自问世以来就成为了对地观测的重要工具。随着应用需求的日益增加,逐渐出现了不同体制的地基SAR系统,为了满足三维信息获取和多角度观测等需求,圆周扫描地基SAR应运而生。与线性地基SAR相比,该系统观测范围更大且具有三维分辨能力
学位
由于铁路运输和轨道交通在我国的发展速度非常迅猛,因此保障轨道系统的安全稳定运行和对轨道交通运输安全维护的工作非常关键。当火车在高速行驶的时候,异物进入列车轨道区域可能会造成巨大事故,给旅客的人身安全和财产安全造成很大的隐患。国内外高速铁路行驶中的最大安全问题来自人、动物进入轨道周界或边坡落石进入铁路限界。所以,在铁路周界区域内进行有效快速的异物侵限实时检测于监控对预保障行车安全发挥着很大作用。随着
学位
汽车的智能化已经成为当前时代发展的必然趋势,而针对车辆行驶环境中的行人进行高精度感知是保障车辆自动驾驶安全性的关键,也是自动驾驶的重要保障。该问题涉及到对行人姿态实现高精度的识别,面临多人姿态识别的复杂性、环境背景的干扰、识别速度与计算开销的均衡等多个方面的困难。本文针对在高复杂背景下应用于自动驾驶上的多人姿态识别网络算法展开研究,针对性解决在车辆行驶环境下多人姿态检测的精准度低、检测速度慢两个方
学位
目前,管道安全预警领域中应用较广的光纤预警系统具有抗干扰能力强、敏感度高等优点,且能够实现对长距离管道运输过程中的外界入侵事件监测识别和定位。该系统利用光纤传感技术采集入侵事件产生的振动信号,然后结合信号处理技术和模式识别技术实现对入侵信号的识别,从而预防入侵事件引发油气管道事故。本文基于相位敏感光时域反射技术的光纤预警系统,开展该系统中对光纤入侵信号的特征提取与识别算法研究。本文首先分析了光纤入
学位
圆周扫描地基SAR(Circular scanning ground-based SAR,GBCSAR)是一种具备三维成像能力的新体制地基SAR系统,它将圆迹SAR模式引入地基平台。区别于传统的直线轨道地基SAR,它通过圆周运动采集数据,从而形成二维合成孔径,掌握场景的三维信息,具备三维成像、数据采集便捷的优势,但其特殊的圆周运动轨迹给三维成像增加了难度。尽管国际上已经理论论证了其三维分辨能力,但
学位
近年来随着航空科技的不断发展,无线遥测遥控领域用户终端以及数据吞吐量在不断的增大,如何高效利用频谱资源已经成为人们研究的热点。为了提高频谱利用率一般可采用扩频技术或者高效的调制方式来实现。成型偏移正交相移键控(SOQPSK)信号属于一类连续相位调制信号,其包络恒定并且具有频谱利用率高和功率利用率高的优点,现已经被列入IRIG106航空遥测标准。美国军方也采用了此标准,用于卫星通信和宇航中。SOQP
学位
近年来航天发射任务日益增多,对遥测系统可靠性要求日益提高。遥测发射机是遥测系统最为核心的工作设备,直接影响着遥测数据获取的质量与效果,决定了遥测任务的成败。传统箭载遥测发射机主要采用超外差结构实现发射通道,该结构采用多级串联变频,结构冗长、使用分立器件多,系统故障率相对较高。本课题结合航天发射任务要求,采用结构简单的零中频结构和冗余备份设计对传统超外差式箭载遥测发射机提出高可靠化改进。设计并实现了
学位