基于时空特征学习的人体动作识别研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:youyoucao_1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于视频的人体动作识别,作为近年来计算机视觉领域中热门的研究课题,被广泛应用于智能安防、智慧医疗、人机交互和视频检索等领域。然而动作的类内差异性和类间相似性增加了动作的识别难度;背景复杂性、视角多样性和光照强弱性也同样影响识别性能。为了改善人体动作的识别性能,本文基于深度学习方法,通过学习动作的时空特征对人体动作识别进行深入研究,主要研究工作如下:1)给出一种基于随机稀疏时间采样方法。大多数人体动作识别方法都是基于视频数据进行识别分类,然而视频中存在数据冗余。因此,对动作分类前需要将视频数据进行采样处理。本文采用随机稀疏时间采样方法,去除视频的冗余问题,并且采用几何变换方法和像素变换方法进行数据增强。2)给出一种基于时空注意力和卷积LSTM相结合的动作识别方法。在Inception V2模型上进行改进,采用随机稀疏时间采样方法覆盖整个动作视频,借助注意力模块与卷积LSTM提取动作识别关键特征,增强模型对动作时空特征的表达能力。给出的方法在UCF101和HMDB51数据集上准确率分别达到了92.45%和66.74%。同时,本章模型的时间复杂度和空间复杂度与其他方法相比都有所下降,验证了本章方法的有效性。3)给出一种基于多角度移位Transformer动作识别方法。本模型在Transformer网络的基础上进行改进,提出局部自注意力和多角度移位分区方法。局部自注意力将动作的时空结构和局部信息整合到Transformer结构中,使得时空内距离彼此较近的特征更有相关性。多角度移位分区方法则整合了视频中局部和全局的动作特征,极大地提高了模型的特征提取能力。本章给出的方法在UCF101和HMDB51数据集上准确率分别达到了94.77%和72.48%,验证了本章方法在动作识别任务中的有效性。
其他文献
移动APP设计上存在的用户体验问题使得用户在使用中常会有各种犹豫,或者说用户的犹豫可能意味着产品设计存在缺陷。是否可以将犹豫行为作为线索来改进产品用户体验设计,是一个值得探索的课题。犹豫行为的特点是随时随地发生、行踪不定,难以采用传统的人工用户研究方法来开展研究,需要新的研究方法。本文作者试图借助一种情境感知的用户数据自动采集工具CAUX,探索如何自动识别用户犹豫行为,以及进一步开展用户体验设计的
学位
余华是一位具有强烈抒情和忧郁气质的作家,他的故事中充满了浪漫和诗意。《文城》的行文中也处处透露着余华的这一文学底色。他以对中国苦难人民的叙事为重点,以英雄的失败、艰辛、苦难、命运和宿命的伦理道德价值来表达文化意识和民族精神,体现了人性的力量美,以及作家对美好生活的寄托,即以文学艺术为引,让心灵找回精神归宿。
期刊
人体姿态估计研究的主要内容是从图像或视频中获取人体关键点的位置,当前主要应用于动作识别、安防监控和医疗辅助等领域。近十年来深度学习迅速发展,同时也带动了基于卷积神经网络的人体姿态估计算法的快速进步。在以关键点坐标为学习目标的人体姿态估计模型中,二维坐标无法为模型的训练提供强有力的监督信息,使得模型的学习难度较大;另外,模型需要通过全连接层来输出坐标值,而全连接层的权重严重依赖于训练数据的空间分布,
学位
目标检测是计算机视觉领域中的一项基础工作,其任务是对图像中存在的目标进行分类和定位。目标检测中对于小目标的检测十分具有挑战性,因为当前目标检测的主流方法仍然是使用深度卷积神经网络,基于深度卷积神经网络的目标检测算法是通过堆叠大量的卷积层提取更高层次的特征信息,来提升模型的检测效果。但由于小目标自身在图像中覆盖面积小、携带的特征信息少的缺陷,经过层层的卷积和池化后,提取到的信息越来越少甚至消失,使小
学位
报纸
随着5G通信的兴起和发展,频谱利用率与信号传输速率会得到大幅度提升,通信系统会具有更高的稳定性与抗干扰性。在得到更好的通信质量的同时,随之而来的,是新增的数十个5G通信频段,和容纳元件更多、构造更复杂的通信系统,这就对射频链路中的微波元件提出了更高的技术需求。滤波器和双工器均是无线通信收发系统中的重要元器件,分别具有频率选择特性与隔离收发信号的功能。在此背景下,本文对设计小型化、高性能的滤波器和双
学位
随着成像光谱技术的出现和不断发展,光学遥感从全色、彩色、多光谱遥感进入到高光谱遥感阶段。高光谱遥感成像可以在空间和光谱上获取丰富的“图谱合一”信息,因其在光谱上独特的“指纹”优势,高光谱在地物识别、环境监测、国防安全以及城市规划等领域都发挥着重要应用。然而,随着光谱分辨率的不断提高,高光谱图像正朝着成百甚至上千个波段发展,使得相邻波段之间具有高度的相关性,极高的光谱分辨率一方面会增加后续数据处理的
学位
由于稀疏表示具有模型简单、计算速度快、对存储容量要求小、对数据的潜在联系有整体性的把握等优势,因此相关研究和应用也愈加广泛。其中,通过在稀疏约束项中使用1-范数及其组合形式来实现不同的稀疏效果是常用的稀疏表示方法之一。大多数情况下,稀疏表示是通过Lasso方法实现的,Lasso是在个体水平对不同的变量进行相同的处理来实现变量选择,这会导致过度压缩绝对值较大的参数并且会忽略数据变量的固有组结构信息。
学位
余华在《文城》中传递出浓厚的传统伦理道德的意味,特别是林祥福对于小美的寻找,其实是可以看作对完整家庭和家庭伦理的追寻。他寻找小美的原因除了爱她之外,更重要的是她给了他一个完整的家庭,后来家也随小美的离去而破碎。在溪镇定居也是因为在溪镇感受到家的温馨,到最后死亡也是为了捍卫心中“家”的完整。因此与其说《文城》讲的是寻妻的故事,不如说是一个寻家的漫长旅程。
期刊
在线新闻服务(如国外的谷歌新闻、微软新闻和国内的今日头条等)已经成为用户获取新闻信息的重要平台。由于每天都会生成各种类型的新闻内容,对用户来说如何从海量的文本中快速找到感兴趣的新闻是一个不小的难题。个性化新闻推荐系统已被广泛应用于各种在线新闻平台,其目标是通过从大量新闻中筛选出用户最有可能感兴趣的文章推荐给用户,从而提高用户阅读体验。目前主流的新闻推荐系统架构通常由召回层和排序层构成,其中召回层使
学位