论文部分内容阅读
近年来,手势以其自然快捷的特点成为了一个十分活跃的计算机视觉研究课题,手势识别可以应用于许多领域,如让失语和失聪患者能够与他人交流、体感游戏、远程操控等,手势识别因此吸引了人们大量的关注和研究。已有的手势识别算法在背景干扰及光照变化等情况下存在计算量大、耗时长、识别率低的问题。深度学习在语音识别、视觉识别和自然语言处理等很多方面的表现都非常不错。在不同类型的深度学习架构中,卷积神经网络(Convolutional Neural Network,CNN)是最适合处理图像数据的。本文的主要工作和成果如下:1.简单介绍了传统的手势识别方法—模板匹配法和隐马尔克夫模型法,重点介绍了基于CNN的手势识别方法,概述手势识别过程中涉及到的相关理论。2.在研究没有检测阶段的手势识别算法时,本文提出了Hand-CNN手势识别算法,该算法主要用于识别目标与背景比例较大的图像中的手势。Hand-CNN算法主要调整AlexNet模型的网络结构,并使用特征融合的方法进行改进以提高手势识别的准确率。实验结果表明,Hand-CNN算法在美国手语(American Sign Language,ASL)数据集上的准确率达到98.2%,相比原来的AlexNet模型,识别率提高了3.2%。3.在研究先检测后识别的手势识别算法时,本文提出了基于Faster RCNN的手势识别算法,该算法主要用于识别目标与背景比例较小的图像中的手势。修改Faster RCNN中的关键参数,达到同时检测和识别手势的目的;然后提出扰动交叠率(DisturbIoU)算法,避免训练模型的过拟合问题,进一步提高识别准确率。在数据集NTU和VIVA上进行手势识别实验的结果表明,该算法有效地避免了训练模型的过拟合问题,比传统算法具有更高的识别准确率和更强的鲁棒性。4.经对比实验证明,本文创新使用的手势识别方法要比传统的一些方法优良和先进得多。