手势语识别中若干关键问题的研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:wangyongwangyongwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语识别作为模式识别研究中的一个热点问题,近年来受到众多研究者的重视。手语识别能够在聋哑人与健听人之间架起桥梁,从而促进社会和谐发展;手语是一种相对规范的手势集合,手语识别为其它手势分析提供借鉴;手语识别涉及计算机视觉、模式识别、机器学习、智能人机接口等研究领域,其研究有助于促进这些领域内其它类似问题的研究。总之,手语识别具有重要的社会现实意义和理论研究价值。   目前,基于特定人的手语识别系统性能较好;然而,非特定人手语识别的性能下降却很明显。自适应手语识别利用新用户数据对初始模型的参数进行修正,使得修正后的模型更适合于新用户。根据自适应数据所属类别是否己知,自适应分为有监督自适应和无监督自适应。有监督自适应需要用户显式采集自适应数据,对系统的易用性造成损害。无监督自适应的数据可以由系统自动采集,易用性更好。然而,使用无标号数据之前必须对其进行标注,以确定其类别。对于无监督的手语识别问题,本文提出一种基于假设比较导引交叉验证的无监督自适应方法,其创新点包括三个方面:   1)提出基于假设比较导引交叉验证的无监督自适应方法。无监督自适应的核心问题是:如何有效利用大量的无标号数据对模型参数进行修正。最直接的无监督自适应方法是自学习无监督自适应方法。在自学习自适应方法中,由于对无标号数据进行标注的模型和待适应模型为相同模型,因此出现错误累积和过适应问题。基于交叉验证的无监督自适应方法通过引入交叉验证思想,将对数据进行标注的模型和待适应的模型分割开来,从而避免出现错误累积和过适应。通过引入假设比较,可提高标注的准确率,提升自适应的性能。   2)建立手语识别无监督自适应数据库。由于无监督自适应方法是采用系统自动累积的大量无标注数据样本对模型参数进行修正,因此,在验证算法的数据库中,每类数据必须包含大量的样本。然而,据我们所知,当前的手语数据库都是面向特定人识别或有监督自适应识别,样本数目较少。因此,本文创建了“上海交大手语数据库”,其中每个类别包含样本多达100个,可以有效验证无监督自适应方法。该数据库未来有望成为验证识别无监督自适应方法的标准数据库。   3)为语音识别、手写体识别等的无监督自适应问题提供借鉴。基于假设比较导引交叉验证的无监督自适应方法独立于手语识别领域,可直接应用于语音识别、手写体识别等其它时序模式识别的无监督自适应问题。   除去自适应问题以外,在复杂动态背景下,遮挡、运动、类肤色物体等的存在使得手部区域的定位和跟踪变得困难。本文提出了一种利用深度信息并结合动态空时规整算法的手势识别框架,尝试解决复杂动态背景下手势识别的问题。当前的计算机视觉技术在复杂动态背景下提取手部精准特征仍旧困难,动态空时规整算法能够在粗略提取手部区域特征时进行手势识别,但是时间复杂度较高。如果利用深度信息辅助特征提取,有助于减少时间复杂度。   本文通过对手语识别的无监督自适应问题和复杂动态背景下的手势识别问题进行深入地探讨和研究,为未来手语识别系统真正走向实用化提供了必要的技术储备,同时也为相关领域研究提供了借鉴和参考。
其他文献
随着无线通信系统的快速发展,以无线局域网为代表的无线数据通信在人们的生活中得到了广泛的应用和发展。此外由于随着CMOS工艺水平的发展和成熟,集成度高和功耗低等特点,它正在
随着通信技术和应用的快速发展,未来的无线网络是由不同的RAT组成的异构网络,一般具有重叠的网络覆盖、互补的技术特性以及多样的业务需求等特征。由于不同的无线网络在业务能
随着科技的进步,车辆给人们的生活带来便利的同时也带来了社会问题,交通安全成为人们普遍关心的话题,同时对于交通领域的相关技术的要求也在不断的提高。车辆检测技术是车辆
随着无线通信的迅猛发展,现有的静态频谱分配模式已经使得无线通信在频谱使用上面临频谱资源匮乏的难题。认知无线电的出现,被认为是解决目前频谱资源利用率低的最佳方案。在认
随着电子技术的快速发展,生产生活中大量电子设备的应用,供电部门和用户开始关注电能质量的问题,电力系统中的非线性设备给电网带来了电压、电流的畸变,使电力系统的电能质量恶化
近年来,网络编码、协作通信、认知无线电等技术由于能大幅提高无线网络性能而成为了无线通信领域的研究热点。与传统通信技术不同的是,这些新技术更多地依赖于无线网络节点间
目前,随着汽车数量的增加,交通拥堵,交通事故频发生等问题也日益恶化,解决这些问题的最佳途径是智能交通系统的发展。而智能交通系统的基础是交通参数的检测。交通参数包括多个方
雷达目标的电磁散射特性表征目标的固有物理特性,包括几何结构和材料等信息。一般来说,雷达目标的电磁散射特性包括散射中心特征和极化特性。散射中心特征可以准确地描述目标
随着对压缩感知的不断探索,稀疏分解技术也得到了人们的越来越多的重视。它通过将信号用字典原子表示使能量分布更加集中,这样就可以更加高效地对信号进行性能分析,而且信号
我国人口众多,老龄化严重,而医疗体制不健全,医院和交通等公共设施长期处于拥堵的状态,为很多老年人就医带来了不便。远程医疗监护系统可以很好的解决这一问题。通过网络的实时传