基于单目视觉的手语-唇语转化系统研究与实现

来源 :东华大学 | 被引量 : 0次 | 上传用户:xhg123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在聋校语言教学中,双语教学模式能有效提高聋童的语言学习效率,但对于特殊教师们来说则需花费更多的耐心、时间和精力。面临着我国特殊教育学校的教师资源普遍薄弱的现状,手语识别技术可帮助特教完成语言教学任务——聋童将手语录成视频输入计算机,进而能够学习输出的汉字和唇语,无需老师亲自教学就能完成汉语书面语的学习。另外,计算机只对标准的手语(以《中国手语》为标准)进行识别,借此还可纠正聋童手语方言化的问题。本文研究的是基于单目视觉的手语-唇语转化系统,其关键难点在于手语识别,具体工作如下:一、视频关键帧提取。首先分析了常见的4种视频关键帧提取方法,为了在能完整提取所有关键帧的前提下尽可能消除冗余帧,提出一种基于聚类的视频关键帧优化提取算法。利用卷积自编码器(CAE)神经网络提取视频帧的深度特征,对提取到的特征进行K-means聚类后,采用清晰度筛选取出最清晰的视频帧作为首次提取到的关键帧,再利用点密度方法进行关键帧的二次优化。实验结果表明,本算法能大量消除冗余帧,并同时保证关键帧的完整性。二、对关键帧进行手势识别。针对手部小目标对SSD目标检测网络做了几点改进:将SE-Net嵌入SSD中的特征层提高重要通道的权重;改变损失函数以更好地应对正负样本不均衡问题;使用mixup和归一化操作优化网络的训练。实验结果表明,本文改进的SSD有更高的识别精度。三、手语-唇语转化系统的实现。为了使系统具有更强的实用性和可推广性,输入的彩色手语视频采用单目摄像头录制;为了使手语者自然地表达,手语者打手语时无需佩戴任何设备或在手上做任何标记。系统的第一个输出为汉字和拼音,第二个输出是与汉字相对应的唇语视频。最后使用Vue.js和Spring Boot技术搭建了展示系统的网页。本系统面向的用户是聋人儿童,希望他们能借助自己熟悉的手语学习汉语,包括书面语和口语,不需要特教亲自反复教学就能进行语言学习,对聋校的语言教学具有一定的辅助作用。整个系统只需要借助一个单目摄像头,脱离了其他技术和外物的限制,因此系统的实用性和可推广性更强,具有很大的应用前景。
其他文献
2017年以来,澳大利亚舆论对华侨华人的态度渐趋负面,形成所谓“华人威胁论”,给当地华社带来较大压力。通过政府报告、政府人士言论以及主流媒体报道,澳大利亚不断渲染“华人
对城市轨道交通技术标准参数的评价,是进行方案选择的前提.基于AHP的模糊综合评判法这种工具为我们提供了这种途径.本文介绍了这种方法的基本理论和操作步骤,并通过实例分析,表明
对宁海国家登山健身步道的发展历程、系统布局、发展模式进行了系统回顾和解析。研究表明,国家登山健身步道系统是一个复杂的系统,具有多样性、层次性、综合性特征,其发展需
斜拉扣挂在缆索吊装中经常运用,但扣索索力多采用手工计算,且多用于5段以内的吊装,计算复杂,精度低.本文提出“零弯矩法“,可计算任意多段扣索索力,既可计算拱肋在施工过程中各节段临
近年来,香港本土主义思潮起伏鲜明、波动频繁,摆脱了原有文化属性,日益显现出极端化、合流化、西化的新趋势,发生明显异化。异化的香港本土主义思潮不断冲击“一国两制”实践
介绍了GPS实时动态定位(RTK)技术的基本原理,一种新的基于RTK功能的高斯平面坐标的GPS道路中线测设的原理方法,其中包括使用一元解决任意复杂曲线的多种中桩点里程定义问题,以及区
在里约奥运会上,英国创下了其百年来奥运参赛史上的最佳成绩,其成功经验如下:备战资金的管理机制注重竞技体育的长远发展;利用严格的评估体系提升备战效率;制定后备人才培养
彭熙作为广东省供销合作联社驻广东省徐闻县公港村党总支第一书记、驻村工作队长,始终矢志不移、用心用情,积极参与和投身到疫情防控、脱贫攻坚和乡村振兴等工作大局中,以强
通过对三峡库区自然环境条件研究表明,三峡库区酸沉降频,库区的一些环境条件(尤其是湿度)对桥梁等建筑物的腐蚀效应有加速的作用,库区桥梁中钢材最容易受到腐蚀,其腐蚀可分为一
本文用类固态热压印法制备了聚碳酸酯微针,通过有限元软件模拟了在微针模具非限域和限域状态下微针的成型过程及工艺条件(压印温度、压强、压印时间)对微针成型的影响;在用非