基于学习时空特征表示的动态手势识别

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:badboyker
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势识别在人机交互、可视交流、机器学习等领域中有着非常广泛的应用前景。越来越多的科研人员开始投身于手势识别研究领域。手势可以分为静态手势和动态手势两种。静态手势指手的一个静止的姿态,只考虑手势的空间信息,不考虑手在空间中的移动和旋转。而动态手势指一个连续的手势动作,既包含了手势的空间信息,也描述了其随着时间变化的运动信息。由于自然手势动作通常都是动态的,因此动态手势识别由于其普遍性和便捷性逐渐成为了一个热点研究课题。但是手势动作受遮挡、光照、视点、个体差异、手势动作时空变化等因素影响,动态手势识别仍然是一个具有挑战性的难题。动态手势识别的一个关键问题是手势特征的表示与提取,传统的方法通常是基于预定义的特征提取,提取的手势特征精确度不高,并且需要相当多的先验知识和人工调整。近年来,基于学习的特征提取方法的性能不断提升,提取的特征具有很好的鲁棒性,因此基于学习的方法逐渐成为目前最流行的特征表示方法。其中两个经典模型是卷积神经网络(CNN)和受限玻尔兹曼机(RBM),不过传统的受限玻尔兹曼机通常是基于向量变量(RBM)的以及基于矩阵变量(MVRBM)的。本文面向基于视频的动态手势识别应用,改进了传统受限波尔兹曼机模型,提出了面向3阶视频数据的3D-2D受限玻尔兹曼机,即输入为3阶张量变量,输出为2阶矩阵变量的RBM模型(3D-2D RBM)。本文也融合了CNN进行图像特征表示的优势,以及MVRBM对二维信号的有效表示能力和神经网络(NN)的判别能力,提出CNN-MVRBMNN混合模型进行动态手势的时空特征表示和分类。上述两个模型能够有效提取视频数据包含的时空信息。本论文具体工作如下:(1)基于3D-2D RBM模型的动态手势识别研究。本文首先提出了3D-2D RBM模型,进一步地,面向动态手势识别应用需求,提出了双通道3D-2D RBM模型(Two-channel 3D-2D RBM)。其中,一个通道建模手势3D视频数据的运动特性,另一个通道建模3D视频数据的空间特性,最后在决策层进行了两通道信息的融合。(2)基于CNN-MVRBM-NN混合模型的动态手势识别研究。本文提出了基于CNN-MVRBM-NN混合模型的动态手势识别方法,该模型由三个子模型组成。CNN子模型自动提取动态手势序列的帧级空间特征,MVRBM子模型基于CNN模型的输出进一步建模动态手势的时空高层语义特征,训练好的MVRBM可有效地初始化NN子模型,使得NN子模型在经过反向传播算法微调后有更强的判别性。本文在剑桥手势库上评价了上述两种方法进行动态手势识别的效果,实验结果表明本文提出的两种方法对于动态手势识别的可行性和有效性。
其他文献
传统单一的状态预测方法难以精确预测航空发动机状态的缺陷,而最小二乘支持向量机(LSSVM)具有较强的非线性预测能力和泛化能力,可以有效地对信号进行非线性预测,隐马尔科夫模型
期刊
水声传感器网络在海洋军事应用、海底探测、海洋环境监测以及国家安全等领域上起着关键作用。时钟同步对水声传感器网络至关重要,是节点定位、数据融合、功耗管理和传输调度
虚拟现实技术的广泛发展已带动相关产业持续飞速发展,其行业包括医学、军事、娱乐等。在力反馈系统的助力下医学领域寻求突破性发展,与虚拟现实技术相结合,为远程医疗和手术
移动互联网时代,社交媒体已经潜入人们学习、工作、生活的方方面面,给用户带来了极大的便利,也让用户产生了厌烦、疲乏等消极使用情绪,即社交媒体倦怠情绪。研究社交媒体倦怠情绪的影响因素,可以帮助企业和相关组织优化社交媒体用户体验,以持续利用社交媒体开展相关业务,同时也有利于用户理性地使用社交媒体,避免倦怠情绪。本研究从用户感知的视角出发,基于“刺激-机体-反应”模型、“认知-情感-行为意愿”理论,构建社
氮氧化物是一种常见的大气污染物,对周围环境和人们健康造成了很大的危害。低温SCR技术因具有运行能耗低、易对现有锅炉烟气净化系统改造等优点,引起人们广泛的关注。所以研
为更好地实践云计算为用户提供廉价按需服务的宗旨,满足服务请求者的个性化需求,提出一种面向个性化云服务的动态信任模型。基于细粒度服务思想定义个性化云服务,通过引入时间衰
期刊
哈罗德·品特(Harold Pinter,1930-2008)是英国著名剧作家。多年的创作生涯中,他不仅获得了所有欧洲戏剧奖项,还获得了 2005年诺贝尔文学奖。记忆是品特戏剧中重要的主题之一
杜中信1942年生于北京。现任中国书法家协会会员、陕西省书法家协会理事、西安文联副主席、西安市书法家协会主席、长安大学书法教授,西安市政协委员