基于时空图卷积网络的手语翻译

来源 :南京邮电大学 | 被引量 : 3次 | 上传用户:apple90317
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语翻译是一个涉及计算机视觉、自然语言处理和模式识别等多个技术领域的综合性任务,在智能场景识别、手语视频检索等领域有着极为广泛的应用前景,尤其对于聋哑群体参与正常交流有着极其重要的意义。本文研究利用图卷积网络(Graph Convolutional Network,GCN)、人体骨架图数据时空特征提取以及编码-解码网络(Encoder-Decoder Network)的序列化建模输出文本,提出基于时空图卷积网络(ST-GCN)的手语翻译方法。基于卷积神经网络的深度模型方法广泛用于诸如图片识别、视频分析等领域中的欧几里德数据处理。非欧几里德类型的人体骨架关节点数据无法被深度模型直接处理,而通常被转换为欧几里德类型的数据易导致结构信息丢失。本文在人体骨架关节点数据上直接采用时空图卷积网络进行手语动作分类识别。首先,借助姿态估计方法获取骨架关节点的位置信息;在构建骨架关节点图数据之后,采用时空图卷积网络提取时空特征;利用softmax分类器实现对视频中手语动作的分类识别。手语数据集的实验结果表明,本文方法能直接对骨架关节点数据提取时空特征并在手语动作识别任务上取得了较好的结果。手语视频中手语动作由手臂动作和手部动作组成,二者在动作幅度,语义精度等方面存在着显著区别。基于全局特征的方法难以区分二者之间的差异化信息,而这些差异化信息通常在特征表示方面对复杂手语动作识别具有稳健的表达能力。于是,针对人体骨架图数据,提出利用双流时空图卷网络模型,分别对人体躯干和手部进行时空特征提取,以有效捕捉不同身体部件间的差异化运动信息。然后,采用特征聚合方法处理所得序列化特征并利用基于注意力机制(Attention Mechanism)的编码-解码网络对即得序列化特征翻译并输出文本。手语数据集的实验结果表明,本文方法能获取更加稳健的特征表示并有效提升手语翻译任务的准确度。针对图卷积网络中的过平滑问题,本文提出基于残差连接的时空图卷积结构解决手语翻译。嵌入该结构能有效解决时空图卷积在连续堆叠过程中出现的域间信息串扰问题。最后,引入Transformer结构构建基于残差连接时空图卷积的手语翻译模型。公开手语数据集RWTHPHOENIX Weather 2014的实验结果表明,本文基于时空图卷积网络的手语翻译方法行之有效,具有重要的参考价值。
其他文献
盐碱土是我国重要的土地资源,对其开发利用日益备受人们的关注。微生物是盐碱土生态系统的重要组成成员,在盐碱土生态效应、土壤理化性质形成和盐碱土质改良等过程中起着重要
太阳能光伏发电系统作为一个复杂系统,其中光伏阵列拓扑结构对整个系统的成本和效率有着重要的影响,它也关系着发电系统能否经济可靠地运行。对比分析了几种常见的光伏阵列拓
重物输送是高空施工作业人员面临的艰巨任务,如何安全便捷地把重物运送到高空作业点,也一直是人们不断研究解决的课题。论文针对高空作业重物输送问题,设计了爬绳载重机器人,
地铁作为人们出行理想的交通工具,其高流动性、高聚集效应决定了它应是传承和演绎城市文化的“第二空间”。然而发展中的中国城市地铁,虽获得了建设速度的显项收益,却付出了
<正>法官作为社会中法律含义之解释者,必须通过科学的自由寻找,使审判结果与正义相互和谐。——[美]本杰明·卡多佐一直以来,法律适用都是司法裁判过程中极为重要的部分。既
会议
危化品是指具有易燃、易爆、有毒或者具有放射性的危险化学品。这些危险化学品往往是工业产品的原料,因为产地的不同需要选用不同的运输方式,目前形成了以公路为主,辅之水路
图的张量积源于矩阵的张量积,在博弈论和自动机理论中有许多应用。作为图的一种运算,利用张量积可以得到许多重要的图类。图的张量积是研究图谱的工具,在图谱理论中发挥重要
在现代线性代数中,Bezout矩阵及其各种推广形式有着非常重要的的应用.本文的研究主要涉及到三个方面的内容:数值型Split-Bezout矩阵和张量积Split-Bezout矩阵在标准幂基下的性
在"互联网+教育脱贫"的背景下,"青椒计划"在全国范围内有序的开展进行。大名县自实施"青椒计划"以来,众多的乡村教师受益于此,极大推进了大名县师资队伍的建设,但实施过程中
介绍了安全的定义、系统安全的特点,探讨了武汉天河机场动力能源保障部系统安全的日常保障机制,提出了交接班的安全流程。