论文部分内容阅读
随着国际化交流日益频繁,多语人才的需求越来越迫切,口语测试的普及率、公平性受到广泛关注。面对传统的口语测试所带来的时空受限、组织成本高、评估主观性强、反馈信息单一等难题,越来越多的计算机技术逐渐被应用到教育领域,从而开辟了计算机辅助语言学习(Computer-Aided LanguageLearning,CALL)这一新学科。伴随着这一学科的发展,各种集成了多项人工智能(Artificial Intelligence,AI)技术的CALL系统应运而生,为口语教育提供了一种全新的学习和测试模式。
面对口语测试的实际需求,本文以利用计算机的客观性和高速、复杂的计算能力对口语进行自动评估并提供一份科学的诊断报告为目标,在对CALL系统的主要组成模块及其关键技术进行介绍的基础上,从以下两个方面入手进行了深入地研究和探索:
(1)针对现有的各种发音质量自动评分算法本身无法单独提供较为可靠的评估结果的情况,本论文提出了一种对多种自动评分算法的得分进行数据融合以提高自动评分与人工评分一致性的新方法,并运用多元线性回归(Multi Linear Regressi0.,MLR)和反向传播(Back Pr0.agati0.,BP)神经网络等数据融合算法进行了实现。在标准口语测试数据集上的试验结果显示:相比融合前的任意一种机器评分,融合后的机器评分与人工评分之间具有更高的相关性和更小的误差,从而验证了数据融合方法的有效性和可行性。
(2)针对现有口语测试方法无法提供系统、及时且信息量丰富的个性化诊断报告的缺点,以CALL系统为基础,通过利用系统评分过程所获得的信息,本论文构建了一个针对考生口语特点的个性化诊断报告生成系统。该系统不仅能够对用户的整体口语水平做出综合性评估,还能够从发音、韵律等多方面进行音素级、字词级的错误定位和诊断,并针对典型错误提出改善意见。这种反馈模式极大地丰富了口语诊断信息的内容,能够对考生之间的水平差异做出比较精确的区分,对考生口语水平的进一步提高具有较强的指导意义。