深度学习驱动的基于智能手表的手语翻译系统

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:c707569552
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语是听力及语言障碍人群广泛使用的功能全面,结构复杂的交流语言。而普通人群对手语缺乏了解,这导致听力及语言障碍群体与外部群体群在巨大的沟通障碍。现有手语研究受限于感知设备、系统价格、识别精度、计算时间和电量消耗等方面而无法提供实时的,可靠的、低成本的、便携且适应日常使用场景的手语识别服务。考虑到当前以智能手表为代表的智能可穿戴设备的计算能力、感知能力大大提升,出货量快速增长的同时价格越来越低。本文提出并实现了一种基于智能手表的深度学习驱动的手语识别系统。该系统包括数据采集系统,离线的模型训练系统和部署在由智能手机和智能手表构成的硬件系统上的实时推断子系统。该系统的智能手表程序采集手表内置的运动传感器数据获取手语信息,智能手机端APP加载离线训练好的模型,并将手语数据翻译为文本,再使用TTS(文本-语音转换)系统转换为语音。本文首先采集了手势数据集,手势识别模型在该数据集上平均识别率达到96%%,可以证明佩戴在手腕的智能手表可以感知足够的手指以及手形的变化信息用以分类。本文创建了包含103个单词,73个常用语句,11680个语句样本的大规模手语数据集。本文提出了一系列针对手语感知数据的预处理、特征提取、参数调优和模型训练的方法,并针对系统的识别精度、对使用场景、采集设备和人体运动的鲁棒性,系统的处理时间和耗电进行了评估。结果显示本系统原型具备较高的识别精度,良好的鲁棒性、实时性和可用性。例如,对手语单词的平均检出率和可信度分别为99.2%%和99.5%%,对手语语句翻译的平均识别错误率为1.04%。对包含11个单词的手语语句的平均处理时间为1.1s。
其他文献
主题班会是高校教育的一种重要途径,本文在分析西南财经大学天府学院八大主题班会的思想内涵、设计理念的基础上,通过问卷调查的方式对随机抽选出的442名大一、大二年级学生
从5个方面介绍了森林净化大汽污染的特殊功能.
由于建设成本及运行能耗较高,长期以来,我国污水处理厂“建不起”或“用不起”的现象较为普遍。为寻求一种更好地适用于我国中小城市污水处理的节能运行方式,本文通过污水处
组成人性的任何要素都具有个体性、群体性及类性。个体之间的关系、群体之间的关系及类之间的关系实质上分别就是个体人性之间、群体人性之间及类人性与其他物类性之间的关系
为了解决钢铁企业烧结烟气脱硫石膏资源化再利用问题,将其应用于盐碱土壤的改良中。通过对两家钢铁企业的不同烧结烟气脱硫工艺的脱硫副产物进行成分及重金属、二英含量的分
高压直流输电系统中有功和无功功率可以分别由dq0坐标系下的d轴电流分量和q轴电流分量独立控制,设计定直流电压、定有功功率定无功功率控制器。整流侧实现单位功率因数整流并
为分析台州市椒江区水环境承载力,从自然环境和社会环境角度评价了水环境综合承载力。首先构建了椒江区水环境承载力多目标模型,基于AHP法确定各层次指标权重值,采用对数函数
结合包装设计活动开展的价值作用看,合理的应用色彩,其所能实现的,不仅是保护具体的商品,也能够在提升商品视觉影响力的同时,提升社会认知。本文拟从茶叶包装设计活动的价值
合作学习是新时期课改的主要目标,是创新性学习的基本组织形式和主要活动方式。因此,在英语口语教学中,应立足新课程改革,结合大学英语教学实践,实施团队合作学习方式,充分发
本文通过查阅国内外相关文献资料,从健康传播的重点环节入手,阐述了城乡居民和流动人口等不同人群传染病健康传播模式,旨在为各地特别是基层开展传染病健康教育和卫生新闻宣