基于视频分段的空时双通道卷积神经网络的行为识别

来源 :计算机应用 | 被引量 : 0次 | 上传用户:xiaziaipao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对原始空时双通道卷积神经网络模型对长时段复杂视频中行为识别率低的问题,实现了一种基于视频分段的空时双通道卷积神经网络的行为识别方法。首先将视频分成多个等长不重叠的分段,对每个分段随机采样得到代表视频静态特征的帧图像和代表运动特征的堆叠光流图像,然后将这两种图像分别输入到空域和时域卷积神经网络进行特征提取,再在两个通道分别融合各视频分段特征得到空域和时域的类别预测特征,最后集成双通道的预测特征得到视频行为识别结果。文中通过实验讨论了多种数据增强方法和迁移学习方案以解决训练样本不足导致的过拟合问题,分析了不同分段数、预训练网络、分段特征融合方案和双通道集成策略对行为识别性能的影响。实验结果显示在UCF101数据集上的行为识别准确率达到91.80%,较原始的双通道模型提高了3.8个百分点,同时在HMDB51数据集上的行为识别准确率也较原模型提高,达到61.39%,这表明本文模型能够更好地学习和表达长时段复杂视频中人体行为特征。
其他文献
目的探讨动态检测血清降钙素原在骨折术后感染早期诊断中的应用价值。方法分别在术后第1、4、7天检测降钙素原、C反应蛋白水平,并与未感染组及对照组进行比较。结果术后第4、7
生产全球化作为经济全球化趋势中最具决定性作用的一个方面 ,对世界经济的发展产生了深刻影响。它通过国际分工、国际直接投资和跨国公司的发展 ,成为推动世界经济发展的新的
近年来随着多层螺旋CT的问世,尤其是64排螺旋CT以更高的时间与空间分辨率,更长的解剖覆盖范围及强大的后处理功能,在头颈部血管疾病诊断中显示出极大的优势。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
白桦树是我国北方的常见树种之一,属于落叶乔木型,适应寒冷的气候,树干较为粗实高大。此类树种适应性强,在种植过程中需要注重对种植方法及养护方法的灵活应用和处理。对白桦
通过对岩溶区桩基础施工存在的难点进行分析,研究出相应的对策,并对岩溶区嵌岩桩施工原理、施工中难点及重点、施工过程、施工关键点进行分析,可以为相似工程提供。
目的探讨铅中毒的现代文献中医证候分布规律。方法检索近18年有关铅中毒中医辨证分型诊断或治疗的文献,采用SPSS16.0统计软件的频数分析方法进行统计分析。结果总结出铅中毒的
为了适应广播电视发展,对广播电视一线的播音员、主持人以及相关的管理人员进行问卷调查,通过分析调查结果,清楚了广播电视的发展对一线播音主持人才的素质与能力需求。要解
在传统实验基础上,减少了实验材料和简化了操作过程,实验现象更直观明显,实现了实验教学随堂化,并对该实验提出了实施建议,对实验教学策略进行了创新,打破了验证性思维的局限
本文以弯曲型河流为研究对象,基于韩其为的泥沙运动统计理论体系,结合模型试验的方法,研究了水流的结构特性及泥沙输移过程。在充分考虑非均匀沙的起动低输沙率、暴露度以及弯道