【摘 要】
:
动作识别的目标是辨识视频中人体正在执行的动作,其作为计算机视觉领域的一项基本而又极富挑战性的任务,在人机交互、虚拟现实、智能视频监控及社会公共安全等众多领域有着广阔的应用前景。传统的动作识别方法由于依赖人工提取特征,存在复杂耗时、抗扰性差以及泛化能力弱等问题。相比之下,基于深度学习的动作识别方法能够利用神经网络模型对数据特征进行自主学习,并且更加高效和准确。本文重点研究了基于深度学习的动作识别方法
论文部分内容阅读
动作识别的目标是辨识视频中人体正在执行的动作,其作为计算机视觉领域的一项基本而又极富挑战性的任务,在人机交互、虚拟现实、智能视频监控及社会公共安全等众多领域有着广阔的应用前景。传统的动作识别方法由于依赖人工提取特征,存在复杂耗时、抗扰性差以及泛化能力弱等问题。相比之下,基于深度学习的动作识别方法能够利用神经网络模型对数据特征进行自主学习,并且更加高效和准确。本文重点研究了基于深度学习的动作识别方法,具体工作如下:(1)针对现有的动作识别数据集样本容量相对较小,导致模型训练中易出现过拟合的问题,本文提出了基于视频的数据增强算法。该算法在保证数据结构和样本标签不变的条件下,利用水平方向上的平移矩阵对视频帧图像进行了随机裁剪,使数据集样本得到了有效扩充,因此在一定程度上降低了模型过拟合的风险。(2)由于动作识别的数据结构是视频帧序列,如果直接将其输入到模型中进行训练,将导致巨大的计算开销。因此,本文提出了一种更加高效的视频帧采样算法。该算法首先对输入的视频帧序列进行分析,然后再在此基础上确定相应的采样策略。实验结果表明,该算法不仅解决了计算成本问题,还使模型的识别准确率得到了提升。(3)针对现有的深度学习动作识别方法,空间特征提取能力不足的问题,本文提出了一种融入空间注意力机制的人体动作识别方法。该方法在空间特征提取过程中设计了融入卷积注意力模块的残差网络,增强了模型对空间判别性特征的提取能力。另外,针对卷积注意力模块在训练中存在左支右绌的问题,本文还对通道注意力部分进行了改进,即:先将平均池化和最大池化的特征拼接融合,然后再训练网络权重。实验结果表明,改进的卷积注意力模块,能使模型对关键信息的定位更加准确。(4)受空间注意力模块的启发,本文在上述研究工作的基础上,提出了融入时空注意力机制的人体动作识别方法。该方法不仅能够有效地对空间性特征进行提取,而且能够利用时序注意力模块获得更好的识别效果。最后,为了说明以上研究工作的合理性,分别在公开数据集UCF11、KTH、HMDB51和UCF101上进行了实验验证。结果表明,所有改进措施均能有效地提升模型的识别性能。
其他文献
地下水源热泵技术可以有效利用浅层深度中具有相对稳定温度的地下水作为低品位热能,因其清洁环保的特点而被广泛应用。抽回灌过程中含水层存在复杂多变的热量运移情况,含水层水动力场变化会引起含水层地下温度场的变化。含水层水动力场是由孔隙水天然流动产生的水动力场和抽回灌过程所引起的水动力场的叠加场,因此孔隙水天然流动会对含水层地下温度场的演变产生不可忽略的影响。尽管目前国内外学者对影响叠加动力场的因素进行了广
园林意象是我国古典园林体系中的重要部分,蕴含深厚的园林美学内涵,其中,很多意蕴丰富的意象在园林中被反复使用,对古典园林空间营造与意境审美起着至关重要的作用,风意象就是其中之一。近年来,越来越多的专家学者参与到园林意象的研究当中,但对于有着丰富文化内涵和独特审美方式的风意象的研究还比较匮乏。现有的对风意象的研究大多集中在传统文化与哲学角度,少量的从园林角度研究风意象的学术成果也仅停留在对景观实例的罗
头脑风暴优化算法结构简单,易于理解。该算法的核心在于模拟人类使用头脑风暴会议解决问题,是目前仅有的受人类群体行为启发的群智能优化算法,具有很强的全局寻优能力和算法鲁棒性。头脑风暴优化算法通过聚类策略,将初始种群分为若干个较小的搜索空间,便于算法进行局部搜索,实现算法收敛。在新个体生成时,算法使用概率参数控制新个体是基于一个类还是两个类生成。同时使用变异策略给新个体添加噪声,实现算法发散,增加算法寻
非牛顿流体在日常生活以及工业中都有着广泛的应用。本文主要研究了黄原胶溶液的流变学实验、羧甲基纤维素钠溶液(CMC)的流变学实验以及导热系数实验、对甲苯磺酸钠溶液的导热系数实验;拉伸板上上随体Oldroyd-B-幂律流体的平面驻点流动及传热问题;上随体Oldroyd-B纳米流体的非稳态平面驻点流动、传热和传质问题。第一部分是所做的四个实验。首先是黄原胶溶液的流变学实验,实验结果表明这种溶液的流动曲线
近年来,我国装配式建筑发展迅速,“十四五”规划中提出推进新型城市建设,推广装配式建筑和钢结构住宅。本文在团队前期研究基础上,提出了一种新的装配式抗侧力钢格构柱结构形式,该结构通过钢筋缀件发生塑性变形来达到抗震耗能的目的。装配式抗侧力钢格构柱具有重量轻、抗震性能好、可实现干法施工等特点。施工现场仅需螺栓连接,可以更好地满足装配化施工要求。本文以装配式抗侧力钢格构柱为研究对象,采用拟静力试验与有限元模
榫卯连接装配整体式剪力墙是一种新型全预制混凝土剪力墙结构,其以带横向凹槽及竖向孔洞的预制混凝土墙板为基本装配单元,具有易于生产、运输、安装便利等优点。本文采用试验、有限元模拟及理论分析相结合的方法,研究了带竖向接缝的榫卯连接装配整体式剪力墙的抗震性能,并对榫卯接缝抗剪承载力计算公式进行了探讨。本文主要工作及取得的主要成果如下:(1)进行了3片剪跨比为1.5的榫卯连接装配整体式剪力墙试件及1片现浇钢
通过查阅近年来关于郑氏"家传八法"的临床研究文献,对二龙戏珠、金钩钓鱼、喜鹊登梅、白蛇吐信、金鸡啄米、老驴拉磨、鼠爪刺、怪蟒翻身等8种特色针法的理论来源、命名及临床研究进行概述,认为郑氏"家传八法"在治疗眼部疾病、腰背部疾病、脑部疾病、疼痛性疾病等方面疗效显著。但在临床应用中仍存在操作手法参差不齐、缺乏客观的临床疗效评价标准、作用机制研究不够深入等问题。因此,在今后的研究中,应规范操作手法,制定客
图像是获取和传递信息的重要手段,在人类的生活中随处可见。图像分辨率的高低是评价一个图像质量的重要因素,分辨率高代表着图像更加清晰、细节更加丰富、质量越高,而低分辨率的图像相比之下会显得较为模糊,使人难以看清,从而无法从中获取完整的信息。然而在图像获取的过程中由于受硬件设备和环境等客观因素的影响,会导致图像的分辨率降低、图像发生退化,这一现象是难以避免的,因此研究如何提升图像的分辨率是有价值的。提升
目前国内关于城市地下空间工程的相关安全防护措施和工程设计技术研究才逐渐起步,国家虽已发布了综合管廊相关技术规范,但针对未来可能发生的事故还可以补充条例。目前已有大坡度综合管廊正在建设当中,管廊结构内诸如管线支架等障碍物也会影响燃气爆炸过程,有必要就坡度和障碍物对综合管廊内的燃气泄漏和燃气爆炸过程的影响进行相关的研究分析,以对综合管廊结构设计规范进行补充并为综合管廊的正常运营提供指导建议。本课题以长
光栅是一种精密的位移检测装置,它的输出很容易和计算机接口.本文介绍了一种可提高光栅测距精度、工作稳定可靠的四倍频判向电路