论文部分内容阅读
随着计算机科学与技术的高速发展,人机交互技术已经进入多通道、多媒体的智能人机交互阶段。利用计算机理解人类的多种感觉和动作,取代鼠标和键盘,使得人机交互方式更加自然、高效,已成为新一代人机交互领域的研究热点。手势及人体姿势作为一种直观、自然地输入操作方式,已成为当今人机交互领域一个重要分支,具有广阔的应用前景和市场价值。在利用手势及人体姿势动作进行人机交互的研究中,微软公司研制的Kinect传感器显示出了卓越的优势,具有良好的研究和应用价值。本文以Kinect传感器为基础,首先对Kinect传感器的技术原理进行分析,利用Kinect传感器获取视角范围内的深度图像,通过深度图像识别出图像中的人体,进而获得人体骨骼点的3D坐标信息,然后结合深度图像对静态手势识别进行研究,结合人体骨骼信息对动态姿势识别进行研究。最后将动态姿势识别的方法与浏览器网页控制技术相结合,实现姿势控制浏览器网页的人机交互系统。主要研究内容如下:1.从手势图像采集和预处理、手势图像分割、手势特征提取、分类器的选择和使用几方面详细介绍本文实验中基于Kinect传感器的静态手势识别方法。包括OTSU阈值分割算法、Hu矩、手指个数提取算法以及本研究所用到的分类器支持向量机。2.在动态姿势识别方面,对Kinect传感器获取的深度信息进行分析,获取人体主要骨骼点的3D坐标,从中选取六个点作为手部运动的特征参照;为了消除每个实验对象的深度定位以及人体体型之间的差异带来的误差,对实验中的数据进行中心化和归一化处理。针对实验中获取的特征,对DTW算法做了适应性调整。为提高识别速度,提出了一种基于查表的DTW算法对得到的特征数据进行模板训练并实现动态手势识别。实验结果表明:该方法具有较高的识别速度和识别率,对复杂背景及光照强度变化具有较强的鲁棒性。3.将动态姿势识别方法应用于浏览器网页控制当中,定义了6种日常生活中常用的手部姿势,实现了动态姿势对浏览器网页的控制功能。测试结果表明:系统对预定义的各种动态姿势识别率高,识别速度快,对不同的光照条件和复杂背景具有较强的鲁棒性,可以满足实际需求。