基于视觉的仿人机器人手势识别技术及硬件实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:xxw1314159
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高仿人机器人的交互性、协作性和学习能力,需对仿人机器人进行多通道交互行为研究。这些研究包括语音识别、人脸识别、面部表情识别、唇读、头部运动跟踪、手势识别以及体势识别等,其中基于视觉的手势识别以其直观,自然的特点受到众多学者的关注。目前一些比较有效的手势识别算法所耗费的计算资源一般都超出了机器人应用中所能容忍的上限,因此本文考虑到静态手势识别算法的时间复杂度和空间复杂度,提出了一个适用于机器人控制和交互的静态手势识别系统。 本文分硬件和算法两大部分对仿人机器人手势识别系统进行了详细论述。 硬件系统部分首先简要说明了系统框架和仿人机器人视觉硬件平台的特点,然后详细讲述了电机控制板的设计方法与性能,最后讨论了电机的控制方法。本文开发的基于DSP TMS320F2812的电机控制板,主频高,外设丰富,扩展方便,可以采用复杂的控制算法精确地同时控制多个舵机,弥补舵机和摄像头本身性能的不足。 算法部分分为手势定位、手势跟踪、手势分割和手势识别四个部分。 (1) 同时采用时间差分运动检测算法和R-G肤色检测算法给手势定位,可快速较准确地定位手的初始质心位置,为手势跟踪的Camshift算法提供比较准确的初始值。 (2) 为排除复杂背景中的肤色干扰,本文引入了光流跟踪法,用于校正Camshift算法的输出结果。实验表明,结合Camshift算法和光流的跟踪算法,能够很好地处理复杂背景下的跟踪问题。 (3) 手势分割采用了在感兴趣的区域内进行颜色分割的方法,可以较好地减小复杂背景中大部分的肤色干扰。颜色分割首先采用了H阈值法,然后对二值图像进行形态滤波,可减小外界干扰,接着采用The-Chin链逼近算法寻找图像的最大轮廓,最后填充最大轮廓包围的区域,得到了手势分割的最终结果。 (4) 手势识别时,选取图像Hu矩的四个不变矩分量为特征量,利用马氏距离进行分类,用该距离值代表待识别手势和模板手势的相似度,识别结果取与最小距离值对应的模板手势。 实验结果表明,最终实现的系统各项性能指标达到了设计要求,能够实时地识别五个静态手势,手势识别率达92.6%。
其他文献
传统的辨识方法如脉冲响应法、最小二乘法等在线性系统中的应用已经相当成熟,但是对于具有明显的非线性特性的对象,用线性模型是无法描述对象的特征的。用BP网络进行辨识容易
我国是世界最大的煤炭生产与消费国,决定了我国大气污染的主要特征为煤烟型污染。燃煤所产生的颗粒污染物、气态污染物氮氧化物(NOx)、二氧化硫(S02)等严重污染了人类赖以生
学位
油气两相流作为工业现场上一种常见的复杂流动现象,其流型检测一直是亟待解决的问题。本文以油气两相流流型检测为研究内容,系统地介绍了两相流的特点、流型的分类及判别方法
以新型嵌入式处理器和嵌入式操作系统为核心的嵌式入系统是近年来通信、工控和消费类电子产品应用中发展最快的技术之一,广泛应用于信息家电、移动通讯、手持信息设备以及工业
故障录波器是分析电力系统故障的重要仪器,本论文在充分分析国内现有故障录波器的结构、功能和存在问题的基础上提出了一种新型的基于DSP(TMS320LF2407A)和CPLD(XC9536)的故障
农林废弃物生物质资源化(如高致密压缩成型)能否发挥最大效能与生物质燃料特性(如水分、灰分、热值等)密切相关;生物炭能源品质与其特性(灰分、挥发分等)品种密切相关。传统的
是谈谈报业利好消息的时候了。我手头有关美国报业的坏消息似乎无穷无尽:期刊上的文章、季度发行量报告、“独立的”调查研究、社评、小组讨论报告,以及不请自到的各类博客文
随着网络技术的不断发展,对计算机的安全要求也逐渐提高,访问控制作为计算机安全的重要环节,日益受到重视。随着P2P(peer to peer)网络形式的广泛应用与研究,对P2P网络上的计算机
学位
计算机网络技术的迅猛发展在推动经济发展和社会进步,为人们的工作、生活带来便利的同时,也不可避免地引发了众多安全问题。隐蔽信道技术作为一种有效的秘密信息传输方式,受到了