基于机器学习的自动发音检错系统研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:bbswile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着在线学习的兴起,计算机辅助语言学习也成为越来越多语言学习者的选择,作为计算机辅助语言学习的两大核心,发音错误检测和诊断反馈能够对学习者的发音问题进行错误分析并给出发音纠正建议,从而提高语言学习者发音水平和学习效率。相对于受到时空限制的课堂语言教学,计算机自动发音检错有着实时、便捷、高效等诸多优点。目前大多数发音检错的学术研究只注重了发音错误的检测,而忽略了反馈纠正的重要性,为了更加直观的对学习者给出发音纠正建议。本文针对学习者由于发音动作的不标准导致的音素级别发音错误类型进行了检错研究,结合机器学习算法对舌位升高(Rising)、降低(Lowing)、偏前(Fronting)、靠后(Backing)和音素拉长(Lengthing)、缩短(Shorting)六类错误进行分类检错实验。并利用互联网技术对实验中的发音检错模型进行Web系统集成设计开发了自动发音纠错系统。论文首先在评估了声学特征以及语音语料库后提出了基于MFCC-RF的发音分类检错模型。采用提取的39维梅尔倒谱系数(MFCC)声学特征作为随机森林(RF)分类器的输入来构建分类检错模型。通过实验结果分析构建的MFCC-RF发音检错模型在Raising、Lowing和Shorting三类错误类型上实现了较高的分类检错准确率。但是,由于发音错误类型样本数据并不是均衡分布,其中另外三种错误类型样本数据相对较少,因此基于MFCC-RF的发音分类检错模型只适用于Raising、Lowing和Shorting三类错误类型的检测,检错范围较小。深度学习近年来被证明非常适用于模式识别与复杂特征的提取。为了在基于MFCC-RF的发音分类检错模型的基础上扩大发音错误检测类型的范围,并进一步提高检错准确率。通过深层神经网络提取声学特征中所含有的深层隐藏信息作为机器学习分类算法的输入。提出基于DBN-SVM的发音分类检错模型,同时采用支持向量机的OneClass思想来解决样本数据不均衡问题。基于DBN-SVM的发音分类检错模型新增了对Fronting、Backing和Lengthing等三种错误类型的检测,完成全部六种发音错误类型的分类检错,并通过实验验证了模型的有效性。然后,论文结合互联网电子化教学方式的流行趋势,采用Java Spring框架结合网页相关技术对发音检错模型进行Web系统的初步设计与开发。实现了学习者自由、在线的进行发音纠错和提高的平台,为未来移动在线英语发音学习的发展奠定了一定的基础。最后对全文进行了总结与展望。阐述了本文自动发音检错系统构建中有待解决和完善的地方和下一步的工作方向。
其他文献
<正> 长期以来,我国实行的是与计划经济相适应的卫生管理体制,决定了医疗机构不是按区域、人群,而是按部门、地方的隶属关系设置。因此,造成各地区之间卫生资源长期存在着差
中国是农业大国,13.2亿人口中7.28亿在农村,农民、农业和农村发展问题是我国政府最关心的问题,建设社会主义新农村也需要农村金融体系的强力支持。本文依据调查资料分析安徽
目的 比较在矫治安氏Ⅱ类 1分类错牙合过程中用方丝弓矫治技术的关闭曲法关闭拨牙间隙和滑动法关闭拔牙间隙的矫治效果。方法 分别用方丝弓技术的关闭曲法和滑动法关闭拨牙
<正>林那北,《中篇小说选刊》杂志社社长,福建省作家协会副主席,福州市文联副主席,全国文化名家暨"四个一批"人才。已出版长篇小说《我的唐山》《剑问》《锦衣玉食》,以及长
根据语音教学、普通话水平培训和测试工作的实践,分析伊犁话与普通话在声韵方面存在的差异,指出学说普通话时应注意的几种方音现象及具体辨正方法。
《柳叶刀&#183;神经学》近日发表了一篇首都医科大学宣武医院神经内科刘疏影的论文。从该论文中表明帕金森病的致病基因LRRK2携带者,以及患者遗传表型的神经递质机制即LRRK2
手足口病是一种常见的传染病,以往的研究表明该疾病与气象、环境和社会经济等因素相关联,其影响关系复杂,而疾病本身体现出较强的区域聚集性,采用普通的线性风险建模方法无法
多属性决策是从已经拟定的一些方案中选择最满意方案的决策。水库调度有很重要的现实意义。本文针对水库调度的多属性决策方法作了一些讨论,主要包括以下几个方面:(1)针对以往
例1,男,74岁。因反复头昏伴双下肢乏力4个月,于2009年7月24日入院。4月前无明显诱因出现头昏伴双下肢乏力,发病以来无头痛及恶心呕吐,无咳嗽、咳痰,无胸闷、气促,无吞咽困难及饮水呛
针对行业及上级单位的要求,浙江省嘉兴市烟草专卖局(公司)今年研究制定了《“互联网+浙烟专卖商业”在嘉兴烟草落地的实施意见》,成立六个专项组开展专题研究,针对可控费用的“数
报纸