基于深度学习的手势检测和识别研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:gg499586617
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势是一种多方面的通信方式,在非语言交流和人机交互中扮演着重要的角色,它们为人机交互(HCI)提供了一种具有吸引力的方案。其中最开始的交互方式,是通过数字手套,生物肌电,kinect深度设备等外接硬件,逐渐发展为基于计算机视觉算法的方式,深度学习的最新进展极大地提高了图像识别的性能,这种方式脱离硬件设备,符合人们方便快捷的使用习惯,但是在手势变化、光照变化或背景复杂的不利现场情况下,手势识别仍然存在局限性,相关的深度学习算法飞速发展,使得手势识别方面的问题都得到了改善。因此,本文将结合图像处理和深度学习的相关知识运用到手势识别中,实现单手和双手手势的识别,改善复杂环境,包括不同光照,复杂背景下的手势识别,并且提出关于图像处理的改善方法,全方面的对手势识别效率进行提高。针对本文的研究如下:针对手势识别双手手势识别算法稀少的问题,研究双手手势的分割识别算法,提出一种基于图像处理的双手手势分割定位的方法,针对双手手势数据集缺失,自制复杂和简单背景的双手手势数据集。研究LBP,PCA和HOG三种传统手势识别方法和深度学习手势识别方法的识别效率对比,并针对于深度学习手势识别方法精度低,收敛性差,鲁棒性低的问题进行改进,在卷积神经网络基础上,引入自适应增强模块,该模块根据每次网络训练的结果进行自适应残差增强提升性能,提出自适应增强卷积神经网络(AECNN)的手势识别模型,并结合YCBCR肤色模型进行手势提取,提高手势识别效率。双手手势分割算法应用于自制双手手势数据集,并结合五层网络的手数分类器实现手势分组预测,实验表明预测正确结果为98.82%。AECNN应用于美国(ASL)9类单手手势数据集,对比传统手势识别方法,局部二值模式(LBP),方向梯度直方图(HOG),HOG结合主成分分析法(HOG+PCA)结合SVM实现手势识别,对比深度学习中的传统卷积神经网络CNN,CNN+Dropout层的手势识别,实验结果表明,AECNN的手势平均识别率高达97.87%,无论是识别率还是收敛性,均远高于传统手势识别方法和传统CNN。对比各个具体手势的识别性能,实验表明大部分手势可准确识别,通过对测试数据添加适当程度的噪声进行手势识别实验和分别抽取不同背景和光照的测试图片进行实验,实验结果表明两个实验平均识别率分别为96%和94%左右,AECNN对于恶劣环境影响的鲁棒性良好。
其他文献
目的:本文就骨髓增殖性肿瘤患者骨髓间充质干细胞的基本生物学特性进行探究,并且初步研究哺乳动物雷帕霉素靶蛋白(mTOR,mammalian target of rapamycin)信号通路在骨髓增殖性患者的骨髓间充质干细胞((BMMSC,bone marrow mesenchymal stem cells)调控肿瘤相关成纤维细胞(CAF,Carcinoma-associated fibroblast
经济全球化的不断深入促进了物流行业的快速发展,为物流行业带来了新的机遇与挑战。自21世纪以来,我国物流行业总体规模不断扩大,发展的条件和环境得以改善,为物流行业的进一步发展奠定了坚实基础。物流是商品交易的重要环节,促进物流行业发展,有利于加快资金周转与商品流通,降低物流成本,从而提高国民经济的运行质量;有利于提高服务行业的比重,转变经济发展方式;有利于缓解交通拥堵,实现社会和经济的协调发展。第四方
近年来,智能机器人技术的研究取得了很大的进步,尤其是在智能装配领域。但对于移动物体的抓取仍然面临一系列的挑战,例如摄像机的抖动、目标遮挡、机械臂运动规划中容易碰撞障碍物、物体轨迹无法提前预测等问题。为了解决上述问题,本文进行了深入的研究,主要研究成果如下:(1)建立机械臂运动学模型,并求出机械臂工作空间,为后期移动平台规划做好基础;根据大臂动量最小原则,求出最优的逆解,并根据实际运动情况,判断各个
“照片分享”在社交场景中占有很大一部分比重,QQ空间、微博、微信朋友圈里自拍占据着大量的版面。目前大部分应用都是以人脸识别技术为基础开发的。随着人脸识别率的不断提升,已经有越来越多的科研工作者开始对人脸局部信息进行深度挖掘,提出了更多有意思、有价值的应用。“变脸”其实就是其中之一。变脸和换脸其实是一种人脸合成技术,通过关键点的检测生成mask模板,采用抠图、贴图的方式实现两张人脸区域的交换,并做一
随着科学和技术的不断发展,控制系统变得日渐复杂,系统部件一旦发生故障将会降低系统性能,甚至会发生灾难性的事故。为了提高复杂系统运行过程中的可靠性能,降低出现故障时对系统的影响,及时的故障诊断尤为重要。故障估计是故障诊断中的重要一部分,其为后续的容错控制处理故障奠定了基础。本文主要研究的是将迭代学习算法应用到非线性系统故障诊断中,设计迭代学习故障估计器,实现对系统故障的准确估计。第1章阐述了本课题的
人的面部表情蕴含着丰富的信息,通过观察人脸表情的变化,可以判断一个人的情绪状态。随着信息技术的发展,人们对人机交互界面的设计提出了越来越高的要求,使得人脸特征建模与表情生成技术在人机交互中发挥着非常重要的作用。如何设计一个具有真实感的人脸表情生成系统是研究人脸表情特征建模与表情生成的一个重要内容。本文通过对人脸表情特征的变化规律进行分析,研究基于回归的人脸表情特征建模算法,从而生成具有真实感的人脸
公共文化服务体系建设作为我国的全球文化战略,对我国经济持续发展和维护社会稳定具有重要作用,如今在新态势发展背景下,存在着供给不均、人才短缺等问题,因此,笔者将在本文中,在分析供给部门结构性改革对于公共文化服务系统基础建造方面,怎样有效提升公共文化服务水准,如何创建公共文化服务系统等方面提出了相对应的改革措施,进一步全面推动公共文化服务科学供给,强化公共文化团队建设,改善补充公共文化服务机制的目标。
随着无线通信业务的猛增,需要更多的频谱资源为用户提供数据传输服务,而当前大部分频谱资源都已经分配给特定的频谱使用者,这样的方式导致频谱资源利用率低的问题,因此认知无线电(Cognitive Radio,CR)技术应时而生,其中动态频谱分配问题是这个技术中的核心,出于提高频谱利用率的目的,本文针对认知无线电和频谱分配问题进行了研究,提出基于改进鲸鱼优化算法(Improved Whale Optimi
社会的发展带动着信息数据的高速运转,为了能更加直观、生动的获取我们所需的信息,数字图像进入了信息载体的“主流”之中。并且随着科技发展不断的推动,数字图像已经以不同形式在教育、医疗、通信、智慧农业、通信等方面发挥着极为关键的作用。快速的发展也带来了一定的弊端,尤其是图像的清晰度问题,使得对于真实信息的获取受到了一定的阻碍。在图像的采集和传输过程中,由于外界环境以及传感器本身的影响,图像会不可避免受到
随着经济发展,社会文化水平提高,文化馆的全民艺术普及事业也开始步入了类似于社会经济"中等收入陷阱"的阶段,传统的文化服务模式已经越来越不适应人民群众对于公共文化服务的要求,文化馆必须进行供给侧结构性改革,引进社会力量,创新服务机制,由传统性文化馆转型为现代型文化馆,以新的模式,继续推进全民艺术普及。