基于深度学习的英语语音识别与发音质量评价

被引量 : 0次 | 上传用户:rlhRLH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球一体化及中国国际化水平的日益提高,我国人民对英语学习的需求飞速增长。但由于国内英语学习环境及教学条件的限制,国内英语学习者普遍存在口语学习困难的情况。随着计算机科学与技术的发展以及语言教学和学习方法的进步,计算机辅助语言学习技术使这一难题有了得以解决的可能。计算机辅助语言学习的核心是语音识别与评价技术,而语音识别技术又是关键所在。由于语音发音变化复杂,语音信号的数据量大,语音特征参数的维度高,语音识别和评价的计算量大,这使得大批量的语音信号处理需要更高要求的软硬件资源和算法。而传统的语音识别算法动态时间规整算法、隐马尔科夫模型和人工神经网络各有利弊,遇到了前所未有的瓶颈,很难进一步提高其准确度与速度。近年来,借助机器学习领域深度学习研究的发展以及大数据语料的积累,语音识别和评价技术得到突飞猛进的发展。深度学习通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输入数据分布式表示,并展现了强大的从少数样本集中学习数据集本质特征的能力,在模拟人脑进行分析学习方面表现更优。本文将深度学习技术应用于英语语音识别,采用基于人耳听觉模型的梅尔频率倒谱特征参数和深度信念网络建立语音识别模型。经UCI机器学习库的Spoken Arabic Digit数据集验证,识别效果优于改进的隐马尔可夫模型、BP神经网络模型和树分布近似模型。在英语发音质量评价方面,当前存在的问题在于:在口语学习方面,国内外一些计算机辅助语言学习系统主要侧重于单词、语法的学习,仅有一两项评价指标作为评价依据,存在一定的功能缺陷,只能给学习者的发音一个整体评分。在口语评价方面,英语口语考试仍以主观意愿较强、标准各异且速度缓慢的人工评分为主,重复性和稳定性较差。针对这些问题,本文以中国大学生的英语语音为研究对象,对传统的计算机英语发音质量评价方法进行改进,考虑音准、语速、节奏和语调等多参量评价指标,即采用基于梅尔频率倒谱特征参数的音准评价、基于语音时长的语速评价、基于短时能量和成对变异指数的节奏评价、基于基频的语调评价。经实验验证,本文所采用的音准、语速、节奏和语调评价方法是可信的。进一步地,考虑以上多参量评价指标的权重,采用回归分析法构建合理客观的英语发音质量评价模型。经实验验证,本文的英语发音质量评价模型方法是可信的,可给予学习者及时、准确、客观的评价和反馈指导,帮助学习者找出自己发音与标准发音之间的差异,纠正发音错误,从而提高英语口语学习效率。
其他文献
电力机车顶盖结构主要由骨架和设备安装座焊接而成,通过对比梁与设备安装座的不同布置方式产生不同效果,说明了骨架和设备安装座的设计对顶盖力学性能影响极大,因此如何设计
<正> 这几年在建筑创作和建筑论坛上出现了前所未有的百花齐放、百家争鸣的繁荣局面,形势十分可喜;也提出了不少值得探讨的问题,应该对这些问题作出解答。为此,我想说点个人
分析了电力机车车体顶盖对车体垂向弯曲振动频率、侧墙横向弯曲振动频率、车体绕纵向轴扭转振动频率的影响,指出车体顶盖对车体垂向弯曲振动频率的影响是很小的,并且通过实例
<正> 我段担负金城江——麻尾区段的运输任务,该区段坡道长大,运行中必须采用电阻制动,以提高速度和减少机车车辆闸瓦、轮箍的磨损,保证列车安全运行。多年来,制动电阻带的烧
铁路是国家的重要基础设施,在综合交通体系中占有重要地位,起着骨干作用。我国铁路主要干线能力目前还十分紧张,除秦沈客运专线外,均为客货混跑模式,客运快速与货运重载难以
针对M-BUS(仪表总线)远程抄表系统市场产品多样,性能参差不齐,本文介绍了一种新型M-BUS远程抄表系统的主机方案,并重点介绍了它的发送电路和接收电路,该方案已经过严格检验,
<正> 这几年,在建筑师中间,有三个问题总是争论不休。第一个问题是有人认为:在古建筑的近旁是绝对不能搞新建设的,搞了就要破坏它的环境。这种担心很有道理,因为事实上确有很
教师角色定位是现代教育中一个不容回避的现实问题。多元智力理论打破了传统单一的智力结构论,使得教师所面对的教学对象由单一的整体转换成了多元化的个体。教师只有把握好自
<正> 中国建筑学会窑洞及生土建筑调研组成立于1980年。几年来,调研组深入开展调研和改革试验工作,取得了一定成绩,曾召开过两次学术讨论会。近来,窑洞问题已引起中央领导同
<正> [文题解析]山河草木、日月星辰、旷郊原野、沙石瓦砾,呈现在我们眼前的自然景观可谓千姿百态,瑰琦壮观。无论何种自然景观写成记叙文,只要有主观认识的参入,任何人都会
期刊