论文部分内容阅读
在人工智能技术快速发展的信息时代,智能设备产品的出现使得人们生活越来越方便。其中,手势识别技术已成为人机交互中颇为重要的一种方式。现有的基于WiFi信号的手势识别技术只能识别单个用户或者较少类型的手势,并且传统的机器学习利用人工提取特征的方法比较繁琐,对细节分类效果有限。所以,研究针对多用户的多种手势识别技术,并提高其识别正确率,实现人机交互的智能化成为该技术实现应用的迫切问题。
针对现有的手势识别技术没有兼备适应用户差异性和手势多样性,而且浅层分类算法需要手动获取手势统计特征等问题,提出了一种基于深度学习的手势识别方法;其次针对单一的深度学习网络提取手势特征不全面,对多用户的多类手势识别精度较低等问题,设计了一种并行的长短期记忆网络(LongShort-TermMemory,LSTM)与全卷积神经网络(FullyConvolutionalNeural,FCN)联合的网络模型。主要的研究工作如下:
(1)对于使用深度学习构建的手势识别方法,首先从WiFi信号中提取信道状态信息(Channel StateInformation,CSI)数据;然后对于手势动作主要包含在低频分量中的特点,研究通过异常点去除、低通滤波器初步滤波以及采用离散小波变换算法,在保证手势特征完整的情况下尽可能去除噪声;最后利用卷积神经网络(ConvolutionalNeural Network,CNN)和LSTM两种深度学习方法分别对CSI数据进行特征提取并识别。
(2)在基于并行LSTM-FCN网络的手势识别方法中,LSTM负责学习手势在时间维度的依赖关系,FCN提取空间维度上丰富的细节特征,通过转置卷积以实现上采样获取像素级别的手势特征,采用全局平均池化防止过度拟合。最后Concatenate层将时空维度提取手势的潜藏特征进行联合,通过Softmax函数对手势分类。
本文提出深度学习手势识别方法比传统的机器学习方法能更好地提取特征。对于多用户的多类手势场景,本文提出的并行LSTM-FCN可以全面的学习手势的空间与时间维度的特征。在实验验证中,实验数据集包含5个用户的50类手势,识别平均准确率约为98.6%,证明了该方法的有效性。通过对比分析并行LSTM-FCN、LSCN、CNN、LSTM四种方法的性能,证明了并行LSTM-FCN具有更高的识别效果。并且讨论了非视距环境对于识别率的影响,结果表明视距环境的手势识别率高于非视距环境。
针对现有的手势识别技术没有兼备适应用户差异性和手势多样性,而且浅层分类算法需要手动获取手势统计特征等问题,提出了一种基于深度学习的手势识别方法;其次针对单一的深度学习网络提取手势特征不全面,对多用户的多类手势识别精度较低等问题,设计了一种并行的长短期记忆网络(LongShort-TermMemory,LSTM)与全卷积神经网络(FullyConvolutionalNeural,FCN)联合的网络模型。主要的研究工作如下:
(1)对于使用深度学习构建的手势识别方法,首先从WiFi信号中提取信道状态信息(Channel StateInformation,CSI)数据;然后对于手势动作主要包含在低频分量中的特点,研究通过异常点去除、低通滤波器初步滤波以及采用离散小波变换算法,在保证手势特征完整的情况下尽可能去除噪声;最后利用卷积神经网络(ConvolutionalNeural Network,CNN)和LSTM两种深度学习方法分别对CSI数据进行特征提取并识别。
(2)在基于并行LSTM-FCN网络的手势识别方法中,LSTM负责学习手势在时间维度的依赖关系,FCN提取空间维度上丰富的细节特征,通过转置卷积以实现上采样获取像素级别的手势特征,采用全局平均池化防止过度拟合。最后Concatenate层将时空维度提取手势的潜藏特征进行联合,通过Softmax函数对手势分类。
本文提出深度学习手势识别方法比传统的机器学习方法能更好地提取特征。对于多用户的多类手势场景,本文提出的并行LSTM-FCN可以全面的学习手势的空间与时间维度的特征。在实验验证中,实验数据集包含5个用户的50类手势,识别平均准确率约为98.6%,证明了该方法的有效性。通过对比分析并行LSTM-FCN、LSCN、CNN、LSTM四种方法的性能,证明了并行LSTM-FCN具有更高的识别效果。并且讨论了非视距环境对于识别率的影响,结果表明视距环境的手势识别率高于非视距环境。