基于目标检测网络手势识别技术的应用研究

来源 :河北工程大学 | 被引量 : 0次 | 上传用户:minlu123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术以及人工智能应用的快速发展,人们对科技改变生活的需求与日俱增,尤其在智能家居领域方面尤为凸显,人机交互成为了人们生活中不可或缺的一部分。其中手势识别以特征简单,实现便捷,组合性强等特点成为了人机交互领域研究的重点,传统的手势识别方法存在精度低,鲁棒性差,实时性差等问题,随着国内外近几年深度学习的发展,为手势识别算法的研究与应用带来了新的方向。本研究基于深度学习对手势识别性能及应用进行深入的研究,充分进行基于深度学习的手势识别研究,做到能够极大提高对手势识别的精度,开发手势识别在不同场景下的应用,提高深度学习对手势识别的利用价值,这对智能家居的使用及发展有重要的意义。本文的主要研究内容如下:(1)使用深度学习目标检测算法进行手势识别的研究。对目标检测网络进行研究,建立多环境下的手势数据集共2250张手势图片,经过数据扩充后对比目标检测网络Faster R-CNN(Faster Region CNN),SSD(Single Shot Multi Box Detector),YOLOv5(You Only Look Once v5)在自建的多环境下的手势数据集上的手势识别模型的性能表现,通过分析对比结果,发现YOLOv5能同时满足准确率高和速度快,但其仍然存在对远距离手势和密集手势的识别准确率低,模型性能有提升空间,则需要改进YOLOv5模型算法。(2)针对需要改进的点对YOLOv5算法进行改进。针对现有YOLOv5算法,为提升其性能,引入注意力机制SElayer(Squeeze-and-Excitation layer)提升模型性能,针对提升小目标检测性能,通过Kmeans聚类出合适先验框,再多增加一个检测头提升对小目标的检测性能,针对提升密集目标检测性能,引入VFnet中的VFloss来替换yolo中的损失函数。通过实验分析改进YOLOv5,其性能得到了提升,并提升了针对小目标和密集目标手势识别的准确率,也能很好的满足实时性。(3)将改进的YOLOv5算法部署移动端并实现手势识别的应用。对改进的YOLOv5算法进行实际应用,将改进的YOLOv5算法部署到移动端jeston nano b01,对Arduino进行开关命令编程,通过串口通信连接Arduino控制的灯开关,从而实现通过手势识别控制开关,实验表明,改进的YOLOv5在移动端能够很好的对手势进行识别,也能满足移动端实时性的需求,并可以实现手势对灯开关的控制。
其他文献
干旱是世界上最为严重的自然灾害之一,其空间分布广、持续时间长,对生态环境、农业生产、水资源供给等方面均会造成不同程度危害,深刻影响着社会经济和人民生活,引起了全球各个国家重视。干旱成因复杂,不同类型干旱的成因与机理不完全相同但又互相影响,中国幅员辽阔且干旱事件频发,因此以流域尺度,探究不同类型干旱事件的时空演变规律及相关关系,对流域干旱的监测及预防具有重要的科学意义。本文以2000-2019年标准
学位
高速水流在泄水建筑物上游表面极易发生空化空蚀破坏。为减轻或消除空化空蚀,许多学者通过在传统直角阶梯溢洪道上增设掺气设施或改变阶梯体型来达到掺气减蚀的目的。本文通过数值模拟,结合模型试验与理论分析,对一种新型反弧阶梯溢洪道的掺气特性进行研究,主要研究了不同反弧半径和来流条件下,反弧阶梯流态和掺气发生位置,主要内容和成果如下:(1)反弧阶梯流态分析:从整体流态和局部流态出发,相比直角阶梯,反弧阶梯有更
学位
报纸
随着社会信息化的发展,信息安全已成为人们普遍关注的话题,作为信息安全领域的代表之一——身份鉴别技术具有非常重要的研究与应用价值。生物特征识别技术因其具有唯一性、稳定性和方便性,逐渐被应用到具体生活场景中。掌纹由于主特征明显、稳定、具有唯一性且较难伪造等特点,相比于其他生物特征识别具有优势,有广阔的应用前景。掌纹本身具有较为复杂多变的特性,基于掌纹的生物识别特征技术的研究较少。传统的掌纹识别原理主要
学位
随着大数据与人工智能时代的到来,越来越多的领域在工作过程中选择使用新兴的科技方式提高工作效率,无论是生产领域、技术领域还是教育领域等,在工作中都在逐渐选择使用人工智能的方式代替传统的工作方式。作为人工智能的重要组成部分,深度学习算法在文字识别、图像处理、语义分析等方面都做出了巨大贡献。在教学管理过程中,对学生课堂行为状态进行分析是提高教学水平与教学成绩的有效手段,传统的课堂行为研究方法一般需要教师
学位
报纸
报纸
蕈菌因其营养丰富而成为中国人餐桌上屡见不鲜的食物,在我国很多地区人们喜欢所谓“野味”,经常采摘并食用不明野生蕈菌,但大部分人欠缺鉴别蕈菌的知识与能力,容易误判蕈菌的毒性,因此常常发生食物中毒事件,极大威胁了我国公民的生命安全。目前,在传统的蕈菌识别方法中,往往都需要大量的经验与专业检测设备,这对于普通民众来说是难以企及的。为保障我国公民的生命健康安全,提高人们鉴别蕈菌的能力,减少类似中毒事件的发生
学位
本工作从经济成本和操作简便的角度考虑,在大气压下以空气和氩气分别作为工作气体,自制一种针板型电极介质阻挡放电装置。交流电源激励下使用电学和光学方法研究了介质阻挡放电的光电特性。从电压、输运电荷信号中获取Lissajous图,计算外加功率。通过等离子体发射光谱,对谱线第二正带系顺序带组采用玻尔兹曼法计算氮分子振动温度(vT),对氩气光谱763.51 nm、772.42 nm两条谱线利用相对强度比值法
学位
数字全息显微成像技术是信息光学、光电子技术以及计算机科学与技术的有机结合,具有无损伤、全视场、非接触、处理灵活、方便储存等优点,同时能获得三维定量的振幅和相位分布。近年来随着深度学习的快速发展,基于深度学习的神经网络层出不穷,许多领域内原来无法解决的问题都可以通过深度学习方法取得突破。其在数字全息领域的应用也越来越广泛,例如解包裹、自聚焦、像差补偿等,为显微成像领域开辟了一条新的研究方向。本论文通
学位