基于弱标注学习和多特征融合的连续手语识别研究

来源 :天津理工大学 | 被引量 : 0次 | 上传用户:su18tt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语是聋哑人之间沟通和交流的主要方式。连续手语识别任务的目标是利用计算机视觉和自然语言处理的相关方法把手语视频序列转换成有序的注释,组成对应的文本序列。虽然目前连续手语识别模型取得不错的评价指标,但是由于手语本身及手语数据集的独特性和复杂性,对于手语数据集中存在的弱标注问题及连续手语特征融合问题仍值得研究。由于手语数据集的弱标注问题,即视频帧的数量远大于对应文本中注释个数,这种弱标注现象增加了视频序列和文本序列的对齐难度,进而影响识别精度。针对这一问题,本文首先利用无监督去冗余思路降低相似帧干扰,增大类间差异性;随后提出一种将随机丢帧与扩展注释相结合的策略,来增大类内差异性,从而降低错误识别率。考虑到手语是一种综合多个身体部位的肢体语言,因此在连续手语识别中需要重点处理多部位特征及融合问题。本文提出一种多步融合模块,用来处理多部位特征融合问题;此外,提出帧间特征与帧内特征融合策略,来融合视频的时序特征和每一帧的分类特征,引入KL散度损失函数辅助训练特征提取器,获得增强的图像特征表达。通过相关模块的消融实验及整体模型的对比实验,实验结果显示出所提模块和模型是有效的。
其他文献
学位
学位
学位
学位
学位
学位
学位
学位
铜锑硫(CuSbS2)是一种新型直接带隙半导体材料,其带隙可在1.4~1.6e V范围内调节,光吸收系数高(>10~5cm-1),晶粒生长温度低(300~400℃)。因而被认为是制造柔性薄膜太阳能电池有希望的候选者之一。电沉积法因具有材料利用率高、厚度及成分可控等优点而受到研究人员的推崇。本文主要采用脉冲电沉积后硫化法制备CuSbS2薄膜太阳能电池,并围绕Cu-Sb金属预制层粗糙度大、硫化过程中S
学位