论文部分内容阅读
手语手势识别旨在将手势动作翻译成文本或者语音形式,以增进聋哑人群体和正常人之间的交流。同时,手势识别技术在人机交互系统的应用中也扮演了不可或缺的角色。从实用角度出发,针对聋哑人交流需求设计的手语翻译装置应满足便携性、一定规模的可识别词汇量、较高的识别效率、低成本等基本要求。基于表面肌电、加速计和陀螺仪等运动传感器的手势识别技术具有实现实用型手语翻译系统的潜力。尽管基于表面肌电和运动传感器的手势识别探索已取得了一定的进展,这种技术距离实际应用仍有较大距离:一方面,当前基于该技术的手语手势识别研究涉及的手语词数量有限,仅为几十种,不能满足日常交流的需求。另一方面,当前的手势识别算法大多在用户有关条件下实现,大词汇量识别下的用户训练负担会限制该技术的实用性。针对基于表面肌电和运动传感器的手语手势识别面临的问题,本文前提出了一种融合表面肌电和加速计、陀螺仪传感器信息的词汇量可扩展手势识别方法,该方法采用手势动作可拆分为多种基本要素的思想,通过较小规模的手势要素识别实现较大词汇量的手势词识别。研究结果显示,本文提出的方案可大大降低大词汇量识别下的用户训练负担,从而可推动实用型手语翻译技术的发展。本文主要工作可概括如下:(1)从手型、朝向、轴向、转向和轨迹五种可有效描述手语手势动作执行特点的手势要素出发,综合分析手势动作执行过程中各要素的变化,提出了一种分段考察手势要素的手势编码方案。(2)在基于要素的手势编码基础上,提出了一种词汇量可扩展的手势识别方案。该方案首先由参考受试者数据确定手势要素的子类,对目标手势集各手势进行要素编码,构建目标手势集编码表。然后,基于表面肌电、加速计和陀螺仪信号特点,对手势要素进行特征提取和分类器设计,并通过手势要素的识别和编码匹配实现较少训练负担下的较大词汇量手势识别。(3)以110个常见中国手语词为目标手势集,在五个受试者(其中Sub3和Sub5分别为参考受试者)数据上验证了本文提出的词汇量可扩展的手势识别方案的可行性。实验结果显示,当训练集规模为目标手势集1/3左右时,目标手势集平均识别率可达(82.6±13.2)%(以Sub3为参考受试)和(79.7-t-13.4)%(以Sub5为参考受试),当训练集规模为目标手势集1/2左右时,目标手势集平均识别率达到了(88+13.7)%(以Sub3为参考受试)和(86.3+13.7)%(以Sub5为参考受试)。