基于单目视觉的实时手势识别系统

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:maygrass
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的不断发展,手势识别已经成为人机交互领域中的一项关键技术。现今,作为一种新型的人机交互技术,手势识别已经成为涉及图像处理、模式识别、计算机视觉等领域的一个比较活跃的课题。然而由于手势本身具有的多样性、多义性、以及时间和空间上的差异性等特点,加之人手是复杂变形体,因此手势识别是一个极富挑战性的多学科交叉研究课题。本文结合国家863课题“基于手势的拟人化人机交互系统”,从手势图像预处理、手势特征提取和手势识别等三个方面研究了基于单目视觉的实时手势识别的相关算法。本文设计并实现了一个基于单目视觉的实时手势识别系统,该系统能够实时地对从摄像头输入的14类常用静态手势进行识别,并通过识别结果对输入法进行控制。系统主要分为三个部分:(1)手势图像预处理:实验表明,人类肤色的色调值在一个较窄的数值范围内变化,具有明显的肤色聚类性,据此本文采用HSV颜色空间进行手势区域分割。在分割手势区域后,对图像进行相应增强操作并使用拉普拉斯边缘提取算法获取手势轮廓;(2)手势图像特征提取:经过对相关特征进行分析,本文最后选用的手势特征是由手势区域特征,Hu不变矩特征以及傅里叶描述子等特征联合组成,结果表明该联合特征能很好的表征手势信息;(3)手势识别部分:多层感知器有着模式识别能力强优点,本文使用多层感知器进行手势分类,同时还使用贝叶斯方法进行实验对比分析。实验结果表明,本文提出的基于手势区域特征,Hu不变矩特征,以及傅里叶描述子组成的联合特征与多层感知器相结合的手势识别方法有着较高的识别率(97.4%),符合高识别率以及实时处理的设计准则。
其他文献
随着Internet的发展,网络资源作为一种新兴的资源正快速增长。网络资源广义上可包括电子文档、电子视频、网络信息、应用程序、网络服务等,对于部分可复制的网络资源,如电子
随着数据库技术的不断发展和其在军事、政府、金融等部门的广泛应用,数据库的安全问题越来越受到人们的高度重视。传统数据库系统提供的安全特性仅能够满足一般的应用要求而
在优先考虑工程安全,供电可靠性的条件下,梯级水库水电站的优化调度,充分发挥水资源系统的除害兴利作用,使总体经济效益最大。梯级水库调度问题是一个复杂的问题,正确、合理
近几年,关于神经网络的研究取得了令人瞩目的进展,引起了包括计算机科学、脑神经科学、人工智能等学科领域内的科学家的巨大热情和广泛兴趣。神经网络是人类对其大脑信息处理
事件信息抽取(Events Information Extraction: Events IE)目前是信息抽取(Information Extraction: IE)中的一个重要领域。本文提出了一种跨文本事件信息融合方法,该方法在
近年来,网络以及硬件的快速发展使得人们被淹没在信息海洋之中,因此,基于内容的视频检索成为一个研究热点,体育视频检索作为其中一部分也得到了广泛的研究。足球比赛深受广大
在当代非线性科学中,非线性方程的可积性是广大学者的重要研究方向之一.本文将结合著名数学家吴文俊的数学机械化思想,并以计算机代数系统Maple为工作平台研究非线性微分差分方
词义消歧在自然语言处理的许多应用领域中具有重要的理论和实践意义,是一个影响着自然语言处理领域中许多其他应用问题的“中间问题”,在机器翻译、信息检索、主题内容分析和
P2P网络存储的网络资源也越来越多,如何在海量的网络资源中精确定位所需资源(P2P的资源定位模型)成为当前P2P研究领域的热点。P2P的资源定位模型决定着资源查找的准确率以及
物联网是通过信息传感设备采集物理世界中物的信息,并将物的信息上传至互联网,其本质是在互联网上实现物理世界的信息共享。物联网的传感设备时时刻刻采集处理现实世界信息,以便