论文部分内容阅读
用于大规模外语口语考试中的计算机自动评分技术是一个新兴而有价值的研究方向。本文针对大规模英语口语考试的朗读题型,对计算机自动评分技术进行了系统地研究,在基于隐马尔科夫模型的发音质量评估技术框架下,针对实际考试的特点,构建了一个高效的用于大规模英语口语考试的朗读质量自动评分系统,并做了一系列工作以提高系统的评分性能。 系统的基本原理是使用一批带有英语教师评分的考生作答数据作为训练数据集,对其中每个考生的语音提取一系列的反映朗读质量的评分特征,并使用其对应的教师评分进行有监督的评分模型训练。对待测数据提取同样的评分特征,使用训好的评分模型来估计待测语音的朗读质量。 评分特征设计的优劣是决定是系统评分性能的关键,也是本文研究的重点和难点。本文依照考生朗读的内容是否严格遵照试题文本、各单词和音素的发音是否准确、整体朗读是否流利等情况设计了一系列的评分特征。为了使特征的提取更加准确,本文还对传统的基于隐马尔科夫模型的语音识别与评估框架中的声学模型训练方法、强制对齐方法和后验概率计算方法分别做出了适应口语考试任务的改进。 实验表明,本文构建的系统的评分准确性已非常接近英语教师人工评分的准确性,而且该系统在一些测试指标上比人工评分的表现更好,这说明该系统已达到实用化水平。目前本文设计的系统已经在广东省部分试点地区投入实用。 本文主要工作和创新点如下: 1.基于主流的发音质量评估技术,构建了一个完整的用于大规模英语口语考试的朗读质量自动评分系统。 2.提出了一种改进的带填充音的强制对齐网络来对考生的多读、漏读等发音现象进行检测,以提高单词和音素的时间切分准确度。 3.研究了将发音后验概率应用于篇章朗读质量评估任务时的面临的问题,并提出了解决方案,包括:将三音子聚类后分别统计音素发音后验概率,以及用基于音素循环网络的解码方法直接计算单词级的发音后验概率。 4.对基于发音后验概率的评分方法进行了深入地分析,并提出了一种基于音素发音混淆矩阵的鉴别性模型训练方法。 5.设计了对朗读语音的发音流利程度进行评估的方法。