论文部分内容阅读
随着在线学习的兴起,计算机辅助语言学习也成为越来越多语言学习者的选择,作为计算机辅助语言学习的两大核心,发音错误检测和诊断反馈能够对学习者的发音问题进行错误分析并给出发音纠正建议,从而提高语言学习者发音水平和学习效率。相对于受到时空限制的课堂语言教学,计算机自动发音检错有着实时、便捷、高效等诸多优点。目前大多数发音检错的学术研究只注重了发音错误的检测,而忽略了反馈纠正的重要性,为了更加直观的对学习者给出发音纠正建议。本文针对学习者由于发音动作的不标准导致的音素级别发音错误类型进行了检错研究,结合机器学习算法对舌位升高(Rising)、降低(Lowing)、偏前(Fronting)、靠后(Backing)和音素拉长(Lengthing)、缩短(Shorting)六类错误进行分类检错实验。并利用互联网技术对实验中的发音检错模型进行Web系统集成设计开发了自动发音纠错系统。论文首先在评估了声学特征以及语音语料库后提出了基于MFCC-RF的发音分类检错模型。采用提取的39维梅尔倒谱系数(MFCC)声学特征作为随机森林(RF)分类器的输入来构建分类检错模型。通过实验结果分析构建的MFCC-RF发音检错模型在Raising、Lowing和Shorting三类错误类型上实现了较高的分类检错准确率。但是,由于发音错误类型样本数据并不是均衡分布,其中另外三种错误类型样本数据相对较少,因此基于MFCC-RF的发音分类检错模型只适用于Raising、Lowing和Shorting三类错误类型的检测,检错范围较小。深度学习近年来被证明非常适用于模式识别与复杂特征的提取。为了在基于MFCC-RF的发音分类检错模型的基础上扩大发音错误检测类型的范围,并进一步提高检错准确率。通过深层神经网络提取声学特征中所含有的深层隐藏信息作为机器学习分类算法的输入。提出基于DBN-SVM的发音分类检错模型,同时采用支持向量机的OneClass思想来解决样本数据不均衡问题。基于DBN-SVM的发音分类检错模型新增了对Fronting、Backing和Lengthing等三种错误类型的检测,完成全部六种发音错误类型的分类检错,并通过实验验证了模型的有效性。然后,论文结合互联网电子化教学方式的流行趋势,采用Java Spring框架结合网页相关技术对发音检错模型进行Web系统的初步设计与开发。实现了学习者自由、在线的进行发音纠错和提高的平台,为未来移动在线英语发音学习的发展奠定了一定的基础。最后对全文进行了总结与展望。阐述了本文自动发音检错系统构建中有待解决和完善的地方和下一步的工作方向。