基于卷积神经网络的手势识别方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:healtw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势识别是人机交互、智能语义识别和远程人机通信等领域的研究热点和难点,在多数复杂情况下难以达到较高的识别率。本文研究静态和动态手势识别问题,基于卷积神经网络本身具有较强的学习能力和对个体特征的表达能力,针对静态手势识别提出扁平卷积神经网络(Flattened Convolution network)和复合密集连接下的卷积神经网络,针对动态手势识别提出融合Inception-LSTM级联卷积神经网络的方法。1、对于简单背景下的手势识别问题,本文利用Kinect深度相机采集不同手势姿态的实验数据样本,在Tensor Flow框架下提出扁平卷积神经网络静态手势识别算法—FD-CNN网络。首先对数据集进行预处理,然后将数据输入FD-CNN网络进行训练,通过与可变形卷积神经网络等方法对比发现,本文方法的识别率较高。2、FD-CNN网络对特征显著、简单背景的图片具有较好的识别效果,但对于复杂背景下的静态手势识别效果较差。因此,本文针对复杂背景手势提出一种基于复合密集连接下的卷积神经网络并利用SGD(Stochastic gradient descent)和Adam(Adaptive Moment Estimation)两种网络优化策略分别对网络进行优化。分别在Thomas Moeslund和Kinect Leap两个静态手势数据库上进行实验,结果表明改进后的网络在RGB图像和深度图像中均取得较高的识别率。3、对于动态手势识别问题,本文构建Inception-CNN网络和LSTM网络融合的结构,首先对输入的视频序列进行编码,然后通过塔式并行Inception-CNN网络实现特征量的提取,将提取出的信息融合成动态时空序列后使用单层LSTM网络进行分类识别。在Cambridge-Gesture、VIVA和Sheffield Kinect Gesture Dataset(SKIG)三个不同动态手势数据集上进行验证,结果表明融合Inception-LSTM级联网络识别率高,对比支持向量机(SVM)、方向梯度直方图(HOG)和卷积神经网络等方法,本文方法取得较好的识别效果,证明了该方法的有效性和鲁棒性。
其他文献
目标检测作为计算机视觉的基础性研究,近年来目标检测在精度和速度方面不断提高,并且在智能驾驶、安全检查等相关方面已经部署应用。本文主要探究在大型养殖场和安防场景中目标检测的应用。前人所做的相关研究主要集中在使用传统的特征提取方法和分类器进行目标检测或采用深度网络加可见光图像的方式。这些方式都有一定的局限性,一是传统目标检测方法相对于深度学习方法精度较低,二是可见光图像在黑暗场景下将无法完成检测。所以
在数字化时代,面临诸多虚假新闻、隐藏金融诈骗团体等情报分析的新问题,本课题组构建了基于复杂网络算法进行人(欺诈者)、物、组织、真假事件及相互关系的感知、理解、预测的情报分析框架IAF(Intelligence Analysis Framework),从基于社会/物理/网络空间中人类电子足迹的大规模电商交易关联网络中,检测出符合特定模式的欺诈行为,是智能情报分析框架中理解模块的关键功能。本文围绕基于
在信息化和智能化深入普及的今天,图像超分辨率重建技术日益成熟并且在日常生活中也开始发挥着越来越重要的作用。该研究在医学成像、遥感成像和公共安防等领域有着广泛的应用前景。近年来随着深度学习的广泛应用,越来越多的超分算法采用卷积神经网络来实现重建任务。现有的算法为得到高质量的重建图片就使用很深或者很宽的网络,这样的网络训练需要占用大量的计算资源和内存消耗,很难在实际中应用;其次是算法重建图片耗时长,重
在智能化信息化深入普及的今天,人们对高分辨率图像的要求越来越高,图像超分辨率重建技术开始发挥重要作用。该研究在图像理解、语义分割以及识别等领域有着广泛应用前景与研究价值。在实际应用中,我们希望超分辨方法不仅能够重建统计意义上的高质量图像,而且能够重建视觉感知意义上的高质量图像。而现有的超分辨算法较难满足两个需求,也就是经常出现客观评价指标与主观评价指标得分不一致的问题。比如,有些超分辨方法所重建图
随着科技创新的日益发展,人类社会不断进步。机器人也成为了人们生活中的一部分,移动机器人开始从事越来越多的枯燥、乏味、具有危险性的工作。如无人餐厅、医院、工厂以及太空等一些人类无法正常工作的环境。本文针对全方位移动机器人越来越难以精确测量的电机参数问题、越来越难以精确建立的数学模型问题以及一些未知的内、外部扰动问题。本文采用自适应滑模控制、自抗扰控制、无模型自适应等控制方法,主要研究内容如下:首先,
煤炭工业长期以来是支撑俄罗斯经济社会发展的主要行业,在俄罗斯国家经济中发挥着重要作用。俄罗斯是我国煤炭进口的主要来源国之一,随着俄罗斯能源强国战略和煤炭东向战略的推行、俄罗斯国内能源消费结构的优化、俄对外贸易政策的调整以及煤运基础设施的逐步改善,俄罗斯煤炭在东亚地区市场的竞争力还将进一步提升。研究俄罗斯煤炭生产、消费、调运及国际贸易现状,定量预测2035年前俄罗斯煤炭可供出口量及运输能力,分析碳中
随着人民生活水平的提高,汽车进入到人民的生活当中。随后日益增加的交通安全问题引起人们的关注。车道线检测作为自动驾驶以及辅助驾驶系统中重要的环节,得到了大量的研究,其核心思想是准确、快速的检测出车道线的位置。传统的车道线检测方法对待检测图像进行边缘检测、阈值化处理和曲线拟合,通过提取车道线的特征检测车道线,依赖于手工操作,算法复杂度大,车道线检测效率低,且基于模型的系统很难对道路场景变化进行建模,因
近年来,在硬件计算能力大幅提高和大数据技术的助推下,以卷积神经网络为代表的深度学习技术发展迅速,为很多领域的研究提供了新的方法,尤其是图像处理领域。利用卷积神经网络人们能从摄像头拍摄的图像中获取更多有用的信息,使得搭载摄像头的自动驾驶汽车具有了更强的感知周围环境的能力,推动了自动驾驶技术的发展。本文主要研究基于视觉的面向自动驾驶汽车的车辆检测算法,主要包括以下内容:首先,本文设计了一个车载专用车辆
船舶的绿色智能化生产建造技术越来越受到关注,但由于船舱内部结构复杂,目前其喷涂工作主要由人工完成。因此迫切需要一种具有极强灵活性和避障能力,可以在狭长、有障碍环境下作业的装备。超冗余机器人拥有卓越的灵活性,具有在船舱内空间作业的工程应用潜力。本文以一种超冗余机器人为研究对象,研究其原理设计和轨迹控制策略,并进行了计算机模拟仿真验证,取得如下研究成果:针对船舱内狭长、有障碍的空间特征,在进行作业需求
无人机因其机动灵活,使用不受地理、环境等条件限制等优势,在不同领域正在得到日益广泛的应用,如航拍、搜救、军事侦察、地形勘测等。同时,无人机应用场景的多样性与复杂性也将难免使得无人机零部件出现各种各样异常或者故障,无人机零部件运行状态是否正常将直接决定无人机能否正常运行。作为无人机系统的重要组成部分,无人机监控系统也面临着应用场景复杂性与多样性的挑战。因此,对于无人机监控系统的研究与设计有着重要的工