论文部分内容阅读
手,作为身体的关键部位,在人们日常生活中发挥着巨大作用,手势更是人与人之间基本的交流方式。随着科技的发展,自然直观的基于手势的人机交互系统为人们日常生活等领域提供了巨大的便利,手势识别技术成为了近年来的研究热点之一本文主要实现了在单目视觉环境下的静态及动态手势识别系统,并将其应用在多媒体播放器控制中。手势识别系统包括建立手势图像库、手势图像预处理、手势分割与划分、手势特征提取、手势分类五大部分。首先,针对现有基于运动轨迹的动态手势存在需要确定起始位置、手势实现伴随大范围幅度移动需要追踪的问题,本文建立了由近红外相机采集的包含8种自定义手势姿态变化的动态手势的手势库。并从手势种类、用户数、手势的姿态三个方面分别描述了采集的动态手势并给出手势样本图像。其次,在手势划分阶段,本文提出了基于帧差的动静态手势划分及基于差分阈值判断的动态手势划分的方法,以解决不同状态手势划分问题。动态手势中由于手势与背景分割和用户个体差异导致的手势变化速度快慢不同,本文提出结合手势分割的阈值选择和关键帧选择的二重选择算法来解决背景分割与手势变化速度快慢问题。实验证实,经过关键帧提取后的动态手势识别不仅提高了识别率而且明显减少了手势识别的运算时间。再次,在手势特征选取和手势识别阶段,针对本文中手势特点,提出将融合Gabor小波变换、主成分分析(PCA)降低Gabor特征维数、稀疏表示分类(SRC)的方法应用于手势分类。经过大量实验,验证了GPSRC算法在静态手势上识别率最高为98.57%,高于PCA结合SRC算法和Sift描述子匹配的算法。在动态手势识别上识别率最高可达95.71%,亦优于PCA结合SRC算法。最后,本文实现了基于本文手势识别框架的音乐播放器控制系统。采用本文提出的手势识别系统,利用离线训练模式,对预定义的手势识别实现调整播放进度、切换播放内容、控制播放声音高低等播放器控制功能。