论文部分内容阅读
随着数字媒体技术的广泛应用及飞速发展,人与计算机的交互活动越来越成为人们日常生活的一个重要组成部分,人们希望能够更有效更自然地与计算机进行交流。虽然新的硬件和应用领域不断涌现,而人们熟悉和熟练掌握的人机交互方式仍然局限于键盘、鼠标等,但它们限制了人机交流的速度和自然性。所以由于计算机科学发展水平的限制,在计算机和人类之间还存在一定的距离。基于视觉的手势识别就成为了实现新一代人机交互不可缺少的一项关键技术。手势是一种自然而直观的人际交流模式。以人手直接作为计算机的输入设备,人机之间的通讯将不再需要中间的媒体,用户可以简单地定义一种适当的手势来对周围的机器进行控制。用计算机来识别手势提供了一个更自然的人机接口。本文在查询了相关文献,取得了如下的研究结果:(1)对人机交互的概况和背景、应用进行了深入的探讨,提出了人机交互方式中新的探索手势识别,对主要研究技术进行详细和全面的论述。研究了基于视觉的手势识别系统的基本框架,对基于视觉的手势定位、手势跟踪、手势分割、手势识别四个阶段的各种原理和方法进行分析。(2)针对手势定位方法中的肤色检测和运动检测方法的各自不足,提出了采用肤色和运动检测相结合的手势定位方法,能够使手势从复杂背景中较为有效地分割出来;(3)深入研究了基于CamShift算法及改进CamShift算法的手势跟踪方法,CamShift算法虽然计算量小但当解决复杂动态变化背景下不能解决大面积肤色干扰问题,因此提出了加入Kalman滤波器对下一个状态作最优估计,实验证明实现了更为有效的手势跟踪;(4)探讨了手势分割方法,采用了计算简单、运算效率较高、速度快的基于自适应阈值的手势分割方法,实验证明能够将从CamShift算法输出的反向肤色概率投影图做一系列形态学处理最后做二值化,使输出为良好的分割结果二值图;(5)提出了结合几何矩和边缘检测结合的手势识别算法。将经过二值化处理后的手势图像,提取手势图像的几何矩特征形成手势的几何矩特征向量。在灰度图基础上直接检测图像的边缘,利用直方图表示图像的边界方向特征。最后,通过设定两个特征的权重来计算图像间的距离,再对手势进行识别。本文使用较为合理的方法借助计算机视觉,数字图像处理,模式识别等理论与技术,通过实验验证完成了计算机通过视觉通道(摄像机)正确感知输入的手势语,同时作出用户所需要的响应(包括要浏览的第几张图片,放大缩小图片),以实现自然的人机交互。