实时视觉手势识别系统的FPGA硬件设计

被引量 : 0次 | 上传用户:zzzzzz1234566666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势识别作为新一代人机交互的一个自然而直观的输入方式,已经受到越来越多的关注。而且,它在人机意图与信息交流、互动娱乐和示范学习等方面的重要作用越来越明显,使手势识别的研究和发展不断地受到越来越多的重视。但是,由于人的手势自身具备许多独特的特征,例如:多样性、多义性、以及时间和空间上的差异性等,加之手势识别系统计算量较大,很难使其在软件上面实现实时的应用,尤其在嵌入式系统。因此,在本文中,我们提出一个用于实时手势识别的硬件架构。并对系统中的模块的构架进行了创新的设计,使其便于硬件实现,提高运行速度。通过取代主要识别算法模块,可以在三个不同的方向使用此体系结构,即,静态手势识别、动态手势识别和手的轨迹识别。而且,整个系统架构在FPGA单个芯片上面实现(即片上系统SOC),所以,其具有低成本和高性能的特点。从整体上面分析,首先,系统利用摄像机捕获格式为YCrCb的图像数据,然后通过高斯概率模型计算每个像素点符合标准颜色像素的概率。再通过阈值的界定,把YCrCb的24bit数据简化成为二值的1bit数据。转为二值图像的操作在简化了后端处理算法的复杂度的同时,也大大减少了FPGA芯片上面存储资源的消耗。然后使用均值滤波把Guass概率模型处理后的图像数据进行降噪处理,在去除白噪声等CMOS图像传感器噪声的同时也虑掉了因光照带入的大部分环境噪声。均值滤波后的二值化图像数据需要从两路输出,一路在乒乓ram中存储,并依次显示,一路用于图像的定位与分割。最后把乒乓ram中的数据进行显示的同时也用于手势识别算法的输入,从而实现图像显示与手势识别的同步。此体系结构使用并行流水线结构,使此基于FPGA的手势识别系统的操作速度显著提高,可达到60帧每秒。而且,手势识别系统良好的实时性能也归因于整体使用同步时钟的设计。在本篇研究中提出的静态识别算法,对现有的指尖检测算法采用了一些必要的约束进行优化,大大提高了识别率,通过测试,其可以达到90.3%。动态手势识别被认为是一个良好的解决人机交互(HCI)问题的方案。在本文中,我采用基于FPGA的纯硬件结构实现了实时的动态手势识别,其整体采用并行结构,可以识别60fps视频流中的动态手势。在轨迹识别模块部分采用状态机的描述方法,能完美的判断出手势在摄像头范围内的运动方向。虽然本文在一个芯片上面构造的纯硬件系统通过替换识别模块,可以很好地解决静态手势识别,动态手势识别和手的轨迹识别的问题,但是距离像手语识别系统这样三方面结合化的应用,还有一段距离。所以,以后的道路仍然需要我们不断的努力,才能在未来的人机交互技术方面续写新的篇章。
其他文献
对于现代人而言,电子商务和远程访问银行已经不止是一种概念了,而已经逐渐成为了人们生活中的一部分。为了保护个人信息和利益,在这些交易中往往需要密码的保护。但是传统的
2004年4月,河北省文物研究所等单位对河北平乡郭桥村发现的一座墓葬进行了抢救性清理,经对墓葬形制及随葬品分析,该墓时代为元代。
目的设计合成喹诺酮类化合物并研究其体外抗肿瘤活性。方法以现有的喹诺酮类药物(诺氟沙星和环丙沙星)为原料,对其进行结构改造,在哌嗪环的N上引入由芳基磺酰氯和单氰胺反应
直接测定土壤水力学性质和某些属性不仅耗时费力,而且成本较高。准确地预测土壤水力学性质和土壤属性以及绘制其三维空间分布图对于研究土壤水分运动和污染物的迁移具有十分
足球运动由于其技术动作多、复杂程度高、对抗性强、变化多的自身特点而成为世界上最受人们欢迎的、迄今为止在全球范围内开展最为广泛的运动项目之一。随着其竞技程度和观赏
媒介的拟仿世界具有突出的虚拟特性,跨越时空界域使媒介审美打上时空集聚效应的烙印,新媒介审美还突显出显著的便携化、泛化与浅表化特性。媒介的发展是一个不断地融合与裂变
近年来,随着毒品犯罪日益猖獗,吸毒驾驶机动车的案例数量逐年上升,毒驾的社会危害性也越来越凸显出来,已经成为危害道路交通运输秩序和公共安全的严重问题。危险驾驶入罪以来
建立多元化公司的一个重要理由是内部资本市场对资金配置效率更高,从而可以增加企业价值。从企业发展历史和现实情况看,公司多元化是许多企业的重要发展战略之一,欧美等大多数发
旅游演艺是无边界产业,旅游演艺的发展是内外部多种因素共同作用的结果,就我国而言,由于市场经济的蓬勃发展,旅游业的发展持续高涨,随之而来的是旅游演艺产业的需求加大。面
计算机网络及通信技术的高速发展推动了企事业单位应用业务系统的蓬勃发展。权限管理是保障应用业务系统安全的核心机制。访问控制模型为实现权限管理提供了科学的理论依据。