论文部分内容阅读
摘 要:人机交换技术已成为日常生活中一个重要部分。比如,汽车导航技术,医疗器械的设计,游戏娱乐,人脸识别,指纹识别等等技术都体现了人机交换的重要性。又由于手势是包含信息量最多的人体语言。因此,本文主要研究手势的识别,尤其是应用在无线遥控车中的手势识别技术。系统实现的重点和难点在于PC机的手势识别部分。基于遥控车的设计,本文对手势识别技术方案设计如下:在手势建模方面,采用基于表观的手势模型;在手势分析方面,从原始图像中抽取的轮廓、边界、图像矩确定采用的手势特征;在手势识别方面,采用模板匹配的方法进行识别。
关键词:手势建模 手势特征 模板匹配
中图分类号:TP39 文献标识码:A 文章编号:1672-3791(2013)03(b)-0018-01
1 总体设计
本项目分为PC机端的手势识别部分和遥控小车部分,系统功能是PC机安装摄像头,实时采集手势图像,根据手势识别结果通过无线模块对小车发送控制命令,使小车完成不同的动作。本系统的总体结构图(如图1)。
本系统手势识别部分设计的结构框图(如图2)。
2 手势识别技术
手势识别的技术方案如以下几点。
2.1 手势建模
在手势识别框架中,手势模型是一个最基本的部分。手势建模主要分为基于表现的手势模型与基于3 d的手势模型。基于表观的手势建模是一种二维建模,从二维平面观察得到的平面图像信息描述于的特征。基于表观的手势模型主要包括基于颜色的模型与基于轮廓的模型两种。基于颜色的手势模型是把手势图像看作像素颜色的集合,通过提取手部的颜色的特征来描述手势。对于一幅彩色图像而言,颜色更利于将手势识别出来。因此本文使用的是基于表现的手势模型,主要是基于肤色的手势识别。
(1)肤色分割,基于肤色彩色信息的检测,主要是根据肤色在空间分布的特点,快速地找到手可能的候选区域,缩小后续细检测的范围,其检测过程为。
彩色空间的转换在计算机视觉中,彩色空间主要有RGB,HSV,HSI,YIQ,YUV等。由于RGB是最为常见的彩色空间,所以可以通过RGB不同的参数值将肤色从图像中检测出来。通过对图像的RGB参数值进行结果分析,R>30,G>15,B>2时手势可以被模糊的识别出来,但是达不到预期效果,所以本文采用了聚类的方法来较为精准的确定人手的候选区域,方法如下:需要从手势取出50~80个能代表肤色的像素,统计手势与该像素颜色相近的像素的数目。同时,改变符合条件的像素的颜色,以确认这些像素是否位于手势上。得到手势候选区域后进行边缘识别,除去自然界中存在着类似肤色的信息。本文采用拉普拉斯算子实现边缘跟踪(如图3)。
(2)手势分析,手势不变矩的定义:对于手势图像函数f(x,y),如果它分段连续且只在XOY平面上的有限个点不为0,则可以证明它的各阶矩存在。手势图像的矩是用所有属于手势区域内的点计算出来的,因而不太受噪声的影响。所以可以用不变距的特性区分手势[5]。
手势有七个不变矩参数,计算手势轮廓的不变矩作为手势的特征,首先根据八邻域法所得到的轮廓矩,来确定手势的轮廓函数f(x,y),f(x,y)中x和y分别为矩阵的标号,而函数值就是轮廓距中相应标号存储的数值[4]。在确定手势的轮廓函数f(x,y)之后,可计算两个不变矩作为手势的特征[1]。这个两个不变矩特征都是具有旋转平移和尺度不变性,同时具有很好的区分性能。
2.2 手势识别
手势识别有3种方法:模板匹配法、神经网络法、HMM。模板匹配方法是一种最简单的识别技术,具有计算简单、速度快的特点。其核心的思想就是将输入的原始数据与预先存储的模板进行匹配,通过测量两个模板之间的相似度来完成识别任务。所以本文采用模板匹配方法进行手势识别。
3 结语
目前,基于计算机视觉的静态手势识别技术研究很多,有基于几何特征的手势识别、基于人工神经网络的手势识别等技术,但仍然存在手势目标检测困难、手势目标识别困难等技术难点,所以,如何准确、迅速地对实时手势图像进行识别具有重要的研究意义。本文对手势识别技术进行研究,根据手势识别结果对遥控车进行控制,其研究成果为手势识别的发展提供理论依据和实践基础,为基于手势识别技术的人机交互开辟更广泛的应用领域。
参考文献
[1]任海兵,祝远新,徐光祐,等.复杂背景下的手势分割与识别[J].自动化学报,2002,28(2):256-261.
[2]Stokoe W C.Sign Language Structure:An Outline of the Visual Communication System of the American Deaf, 1960,Buffalo,NY:Linstok.
[3] 朱继玉,王西颖,王威信,等.基于结构分析的手势识别[J].计算机学报,2006,29(12):2130-2137.
[4]周航,阮秋琦.基于表现特征的手势识别[J].广西师范大学学报,2003,21(1):25-30.
[5]葛元,郭兴伟,王林泉.傅立叶描述子在手势识别中的应用[J].计算机应用与软件,2005,22(6):12-13.
关键词:手势建模 手势特征 模板匹配
中图分类号:TP39 文献标识码:A 文章编号:1672-3791(2013)03(b)-0018-01
1 总体设计
本项目分为PC机端的手势识别部分和遥控小车部分,系统功能是PC机安装摄像头,实时采集手势图像,根据手势识别结果通过无线模块对小车发送控制命令,使小车完成不同的动作。本系统的总体结构图(如图1)。
本系统手势识别部分设计的结构框图(如图2)。
2 手势识别技术
手势识别的技术方案如以下几点。
2.1 手势建模
在手势识别框架中,手势模型是一个最基本的部分。手势建模主要分为基于表现的手势模型与基于3 d的手势模型。基于表观的手势建模是一种二维建模,从二维平面观察得到的平面图像信息描述于的特征。基于表观的手势模型主要包括基于颜色的模型与基于轮廓的模型两种。基于颜色的手势模型是把手势图像看作像素颜色的集合,通过提取手部的颜色的特征来描述手势。对于一幅彩色图像而言,颜色更利于将手势识别出来。因此本文使用的是基于表现的手势模型,主要是基于肤色的手势识别。
(1)肤色分割,基于肤色彩色信息的检测,主要是根据肤色在空间分布的特点,快速地找到手可能的候选区域,缩小后续细检测的范围,其检测过程为。
彩色空间的转换在计算机视觉中,彩色空间主要有RGB,HSV,HSI,YIQ,YUV等。由于RGB是最为常见的彩色空间,所以可以通过RGB不同的参数值将肤色从图像中检测出来。通过对图像的RGB参数值进行结果分析,R>30,G>15,B>2时手势可以被模糊的识别出来,但是达不到预期效果,所以本文采用了聚类的方法来较为精准的确定人手的候选区域,方法如下:需要从手势取出50~80个能代表肤色的像素,统计手势与该像素颜色相近的像素的数目。同时,改变符合条件的像素的颜色,以确认这些像素是否位于手势上。得到手势候选区域后进行边缘识别,除去自然界中存在着类似肤色的信息。本文采用拉普拉斯算子实现边缘跟踪(如图3)。
(2)手势分析,手势不变矩的定义:对于手势图像函数f(x,y),如果它分段连续且只在XOY平面上的有限个点不为0,则可以证明它的各阶矩存在。手势图像的矩是用所有属于手势区域内的点计算出来的,因而不太受噪声的影响。所以可以用不变距的特性区分手势[5]。
手势有七个不变矩参数,计算手势轮廓的不变矩作为手势的特征,首先根据八邻域法所得到的轮廓矩,来确定手势的轮廓函数f(x,y),f(x,y)中x和y分别为矩阵的标号,而函数值就是轮廓距中相应标号存储的数值[4]。在确定手势的轮廓函数f(x,y)之后,可计算两个不变矩作为手势的特征[1]。这个两个不变矩特征都是具有旋转平移和尺度不变性,同时具有很好的区分性能。
2.2 手势识别
手势识别有3种方法:模板匹配法、神经网络法、HMM。模板匹配方法是一种最简单的识别技术,具有计算简单、速度快的特点。其核心的思想就是将输入的原始数据与预先存储的模板进行匹配,通过测量两个模板之间的相似度来完成识别任务。所以本文采用模板匹配方法进行手势识别。
3 结语
目前,基于计算机视觉的静态手势识别技术研究很多,有基于几何特征的手势识别、基于人工神经网络的手势识别等技术,但仍然存在手势目标检测困难、手势目标识别困难等技术难点,所以,如何准确、迅速地对实时手势图像进行识别具有重要的研究意义。本文对手势识别技术进行研究,根据手势识别结果对遥控车进行控制,其研究成果为手势识别的发展提供理论依据和实践基础,为基于手势识别技术的人机交互开辟更广泛的应用领域。
参考文献
[1]任海兵,祝远新,徐光祐,等.复杂背景下的手势分割与识别[J].自动化学报,2002,28(2):256-261.
[2]Stokoe W C.Sign Language Structure:An Outline of the Visual Communication System of the American Deaf, 1960,Buffalo,NY:Linstok.
[3] 朱继玉,王西颖,王威信,等.基于结构分析的手势识别[J].计算机学报,2006,29(12):2130-2137.
[4]周航,阮秋琦.基于表现特征的手势识别[J].广西师范大学学报,2003,21(1):25-30.
[5]葛元,郭兴伟,王林泉.傅立叶描述子在手势识别中的应用[J].计算机应用与软件,2005,22(6):12-13.