基于卷积神经网络的手势识别算法研究

来源 :重庆工商大学 | 被引量 : 2次 | 上传用户:manaijin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,计算机等智能设备已进入千家万户,与智能设备进行人机交互逐渐成为人们日常生活中必不可少的一部分。人机交互主要通过人与计算机之间的信息转换,达到控制,操作计算机或者智能设备,以实现功能和目的。人机交互在手语识别、虚拟现实、设备控制以及娱乐等方面受到了广泛的关注。手势交互因其便捷、普遍受到广大研究者的关注,同时因智能手机等设备获取手势图像快速且便捷,研究基于计算机视觉的手势交互成为人机交互研究领域的热点话题。但手势图像包含复杂多样的背景噪音,比如光照、背景重叠遮挡等,基于计算机视觉的手势识别仍然面临巨大的挑战。机器学习和深度学习的出现为基于计算机视觉的手势识别提供了新的思路。本文深入研究了基于计算机视觉的手势识别问题,提出一种基于卷积神经网络的手势识别方法,实现了复杂背景下手势的准确、快速识别。本文研究主要包括以下几个部分:(1)为了减少手势图像中复杂背景、光照等噪声对识别性能的影响,提出基于DSSD(Deconvolutional Single Shot Detector)的手势图像检测算法。首先,以VGG为基础网络,并增加用于特征提取的卷积层,构建基于SSD(Single Shot MultiBox Detector)的目标检测模型,然后利用数据集对监测模型进行训练和测试。为了提高小目标检测的精度,将浅层和深层的特征信息进行融合,提出基于DSSD的手势检测算法,实验结果表明了该模型能够有效检测手势区域。(2)为将手势从背景图中分割出来,以提高手势识别精度,提出基于生成对抗网络(Generative Adversarial Networks,GAN)的手势图像分割算法。首先,将AlexNet网络全卷积化,然后使用跳级结构结合多层特征进行反卷积,建立基于全卷积神经网络(Fully convolutional Network,FCN)的手势分割算法。然后,针对FCN的上下采样导致的手势图像分割后细节丢失的问题,并借鉴生成式对抗网络的思想,提出基于生成式对抗网络的手势图像分割算法。最后在公共数据集上评估了手势图像分割算法的性能,试验结果表明基于生成对抗网络的手势图像分割算法能够剔除背景和噪声区域,有效提取到手势区域。(3)为了实现手势的有效识别,提出基于GoogLeNet网络的手势分类模型。首先利用分割的手势图像建立训练集合,并对识别模型进行训练。在测试阶段,输入一幅分割图像到识别模型中,其输出为该图像的类别。在实验中,分别利用原始手势图像、手势检测图像、手势分割图像训练GoogLeNet网络,得到三种手势识别模型,然后对这三种模型的识别结果进行分析和比较。实验结果表明,基于GoogLeNet网络的识别模型具有良好的稳定性,能提取到复杂背景下的图像的鲁棒特征,提高手势识别的精度。另外,手势检测和手势分割预处理算法能够改善手势的识别精度。
其他文献
狗年的春节刚刚过去,玻璃界就爆出两大新闻。一个是“中国玻璃公司”对业内企业的收购事件,一个是皮尔金顿董事会同意板硝子现金收购。一个使中国玻璃产业的格局发生变化,一个预
通信技术的不断发展使得人们的生活水平得到了极大的提高,然而通信水平的提高对于通信工程来说也提出了越来越多的挑战。将先进的科学技术转化为提高人们生活水平的实际应用,是
《从百草园到三味书屋》一文告诉我们:三味书屋的读书生活实在是无味的。但是,我们却不因此而觉得文章也无味。这个原因是,鲁迅把三味书屋的无味生活写得有趣极了。然而,深入
炎症是一种生活中很常见的机体应对外界刺激的防御反应,炎症部位会出现红、肿、热、痛的症状,其中炎症性皮肤病还伴有瘙痒反应。无论疼痛还者瘙痒都是令人不愉快的生理感觉,
结合近几年来国内发生的一些重大突发性水环境污染事件,分析粉末活性炭在应急处理中广谱性、安全性和稳定性的特点,肯定了粉末活性炭在应急处理中的重要作用。它能有效去除臭
会议市场的最终买家是大众消费。要把公款用于大众消费和个人“掏腰包”消费引入会议市场,按照市场规律办事,解决会议消费谁来买单的问题。
作为行业协会负责人,对我们国家行业会议之多之滥,深有体会。这一点,从会议名称上就能感受得到。记得二十多年前,最时兴的是高峰、峰会之类的字眼,用今天的话,高大上;之后为论坛、大
为了使人生幸福,必须去热爱日常琐事,云彩的光辉,竹子的摇曳,群雀的啼叫,路人的面孔——必须在这所有的日常琐事中感受着无比的甜美。
中国石油华北油田分公司第三采油厂(简称采油三厂)作为华北油田原油生产能力最大的单位.承载着维护油田公司持续、健康、和谐发展的重要责任。一直以来,采油三厂在优化采油工艺、