论文部分内容阅读
手语是听力及语言障碍人群广泛使用的功能全面,结构复杂的交流语言。而普通人群对手语缺乏了解,这导致听力及语言障碍群体与外部群体群在巨大的沟通障碍。现有手语研究受限于感知设备、系统价格、识别精度、计算时间和电量消耗等方面而无法提供实时的,可靠的、低成本的、便携且适应日常使用场景的手语识别服务。考虑到当前以智能手表为代表的智能可穿戴设备的计算能力、感知能力大大提升,出货量快速增长的同时价格越来越低。本文提出并实现了一种基于智能手表的深度学习驱动的手语识别系统。该系统包括数据采集系统,离线的模型训练系统和部署在由智能手机和智能手表构成的硬件系统上的实时推断子系统。该系统的智能手表程序采集手表内置的运动传感器数据获取手语信息,智能手机端APP加载离线训练好的模型,并将手语数据翻译为文本,再使用TTS(文本-语音转换)系统转换为语音。本文首先采集了手势数据集,手势识别模型在该数据集上平均识别率达到96%%,可以证明佩戴在手腕的智能手表可以感知足够的手指以及手形的变化信息用以分类。本文创建了包含103个单词,73个常用语句,11680个语句样本的大规模手语数据集。本文提出了一系列针对手语感知数据的预处理、特征提取、参数调优和模型训练的方法,并针对系统的识别精度、对使用场景、采集设备和人体运动的鲁棒性,系统的处理时间和耗电进行了评估。结果显示本系统原型具备较高的识别精度,良好的鲁棒性、实时性和可用性。例如,对手语单词的平均检出率和可信度分别为99.2%%和99.5%%,对手语语句翻译的平均识别错误率为1.04%。对包含11个单词的手语语句的平均处理时间为1.1s。