基于图卷积网络的交警手势识别研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:yxl0173
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交警指挥手势识别是智能交通领域中一项非常重要的研究课题,在辅助驾驶、无人驾驶中有着广泛的应用价值。现有基于图卷积网络的交警手势识别方法存在两个问题。问题一是现有基于图卷积的交警手势识别方法易受复杂背景和过平滑问题的影响,导致特征提取不准确。现有图卷积方法易受图像背景中移动行人的影响,冗余的行人骨架数据导致交警手势特征提取不准确。同时,图卷积的过平滑问题使得手势特征随着卷积过程而被同化,降低了行为特征的可分辨能力。问题二是现有图卷积网络在建模交警手势时存在空间特征提取不准确和时域特征表达不充分。现有图卷积网络在空间上忽略了对行为特征表达更强的肢体动作信息的提取,在时域上也只使用一维普通卷积获取连续帧的时间信息,缺乏从多个时域跨度上提取时序特征的能力。针对问题一,本文提出了一种基于结构化模块和交叉池化图卷积网络的交警手势识别方法。结构化模块通过目标检测算法、姿态估计算法、冗余骨架过滤算法等一系列预处理手段优化交警骨架信息的提取,减少无关信息的干扰,为后续分类网络提供准确的数据支撑。同时,为了从交警骨架数据中有效建模手势特征,提出的交叉池化图卷积网络不仅通过构建全局交叉池化自适应地迭代池化组件来缓解图卷积的过平滑问题,还优化交警骨架拓扑图结构以增强手势建模,从而提高了交警手势识别准确率。针对问题二,本文提出了一种时空增强型图卷积网络以提取更具鉴别能力的手势时空特征。时空增强型图卷积网络主要由多级融合模块和时域扩展模块构成,多级融合模块在空间维度上通过空间自适应图卷积和部位特征提取器分别提取低层次的关节特征和高层次的肢体特征,并融合这两种级别特征以增强空间特征信息。时域扩展模块通过引入一维空洞卷积从多个时域跨度建模时序动态,提取了丰富的多尺度时域特征,从而增强了网络模型从复杂手势动作中捕获重要帧间时域关联信息的能力。本文对上述提出的方法进行了充分的实验。实验结果表明,本文所提的基于结构化模块和交叉池化图卷积网络的交警手势识别方法可有效减少复杂的背景干扰,提取准确的交警骨架数据,并缓解图卷积网络的过度平滑问题,实现了较高的识别准确率。此外,本文所提的时空增强型图卷积网络不仅进一步提高了交警手势的识别效果,而且该模型在两个大型人体动作识别数据集上实验结果也优于现有主流动作识别方法。
其他文献
智能信息时代的来临,引发了科技的不断革新,使人们的生活方式发生改变,产生了日新月异的变化。在信息化的环境下,手机的拍摄功能为人们获取文档的相关内容提供了便捷的途径,有利于实现文档材料的检索与查阅,提高文档的分析与识别效率。在这个过程中,文种识别任务作为文档分析与识别的首要工作,占据着无比重要的地位,对后续的文本检索与文字识别等任务发挥着至关重要的作用。然而在文种识别的研究中,基于手机拍摄文档图像的
学位
互联网金融领域的快速发展给人们生活带来极大便利的同时,也暴露着巨大的信用风险。在金融领域中如何预测信用卡申请者是否具有欺诈行为已经成为当今金融机构需要解决的一大问题。金融风险防控正是在这样的背景下应运而生,金融机构可以对申请者建立风险评估模型,借助申请者的个人信息与社会活动轨迹来发现其潜在风险,从而减少自身的损失。然而,信贷预测是一个典型的数据不平衡的二分类问题,数据具有类别不平衡、特征维度较高的
学位
结构健康监测技术(Structural Health Monitoring,SHM)是土木工程结构监测和维护的重要技术,已广泛应用于实际工程中。我国是铁路大国,铁路运输的地位突出,铁道结构健康监测对维护铁路运输安全,保障人民生命财产具有重要意义。我国在许多铁道上安装了结构健康监测系统,这些系统常使用传感器收集信号数据以定位损伤和分析受损程度。如何根据已收集的数据有效诊断铁道的损伤是亟待研究的科学问
学位
脑机接口作为一种多学科交叉融合的新型信息交流方式,在医疗康复、军事国防、消费娱乐等领域有广泛的应用前景,其关键的技术是对运动想象脑电信号进行分类。针对现有传统的运动想象脑电信号分类方法,在特征提取过程中无法很好兼顾脑电信号的时域和空域特征,以及分类精度难以达到实际应用需求的问题。本文开展基于注意力机制的门控循环单元和跨层残差连接网络的运动想象脑电信号分类方法的研究。课题的主要研究内容如下:(1)研
学位
近年来互联网等多媒体的迅速发展,使得大量的人脸信息在各类平台中共享传递。与此同时,人脸识别技术快速地融入了现代人的生活,在带给人们便利的同时也带来了诸多安全问题。不法分子利用隐蔽的图像采集技术,从各大平台窃取个人图像信息,再利用高效的深度学习人脸识别技术工具,对人脸图像识别,从而获取受害者的身份信息,严重侵犯公民的隐私权益。针对以上问题,本文研究了人脸识别深度神经网络模型和对抗攻击的相关方法,提出
学位
随着互联网被越来越多的人使用,互联网上存积了很多数据。商品评论,店铺评论等各种各样的评论文本充斥在网络平台上。这些评论文本的信息蕴含了很多有用的信息。因此从评论文本中分析情感的技术就显得尤为重要。传统的情感分析一般是粒度较粗的情感分析,但是粗粒度的情感分析已经不能满足人们的需求,而针对文本中特定属性的细粒度情感分析则能很好地解决这个问题。本文在之前的细粒度情感分析模型的基础上,对原来的模型进行改进
学位
数字图像作为一种重要的信息载体,在人们的日常生活中应用广泛。因此,保证图像在恶劣的网络环境中能够安全稳定地传输就显得尤为重要。本文基于混沌系统和离散余弦斯托克韦尔变换设计了两种安全、高效的图像加密算法。本文的主要研究工作如下:提出了一种基于六维非退化离散超混沌系统、二维离散余弦斯托克韦尔变换(Two-dimensional discrete cosine Stockwell transform,2
学位
随着国内动漫产业的火爆,越来越多的人开始关注生成对抗网络在动漫领域的应用,如短视频平台的动漫风格迁移以及动漫头像生成等。传统的生成对抗网络在动漫头像这类细节复杂的图像生成效果往往欠佳,主要表现在:一方面大部分生成对抗网络在动漫头像的生成上会呈现出训练不稳定,生成样本的多样性差,容易会出现模式崩塌;另一方面生成样本质量不高、人物局部细节效果不好造成图像失真。针对上述问题,本文以生成对抗网络为基础,对
学位
地球外辐射带是指地球周围较远区域(相比于内辐射带)包含大量高能带电粒子的聚集区。外辐射带高能的电子将会对卫星的飞行和宇航员出舱活动造成极大的威胁。因此对于地球外辐射带中电子通量的研究一直是空间物理学科中一个非常重要的内容。又由于近几年人工智能技术的兴起,不少研究人员开始将人工智能技术运用在对地球外辐射带中电子通量的研究上。本文主要内容是对地球辐射带中电子通量的拟合,接着延伸到对地球外辐射带中电子通
学位
表情是人类表达心理活动和情绪状态的一种最自然、最普遍的方法。随着深度学习的发展,人脸表情识别技术广泛地运用在情感模拟、辅助驾驶、网络教育、辅助医疗和刑事侦探等多种领域。本文针对细粒度条件下的静态人脸表情识别展开研究。当前人脸表情识别工作中主要存在着两大问题。(1)卷积神经网络在卷积和池化过程中,不同尺度特征之间缺乏高效的交流和融合,高维特征易丢失关键的细粒度信息,如纹理和边缘等,导致人脸表情的识别
学位