论文部分内容阅读
随着计算机技术和语音识别技术的发展进步,出现了计算机辅助语言学习(CALL,Computer Aided Language Learning)系统,利用CALL系统进行发音辅助学习,学习者可以即时获得有效的反馈。普通话评测属于语言学习的研究范畴,普通话水平测试电子化系统有助于高效地进行测试。
声调是区别方言与普通话的重要标尺,某种程度上决定了一个人普通话水平的基本面貌和基本水平。因此在普通话水平客观测试系统中,声调的客观评测是一个非常重要的子系统。对于连续语流,由于受上下文的影响,字调之间存在不可忽视的连续性,变调现象普遍存在且具有多样性,给声调识别器的结果带来严重的混淆,进而影响声调评测系统的实际性能。本文利用连续语流中韵律耦合效应和韵律信息紧密相关这一特性,着重在建模的经典方法基础上提出了利用上下文的声韵母和声调信息、当前音节所属韵律结构等韵律信息的建模策略,使得汉语普通话水平评测系统中连续语流声调评测子系统性能得到有效的提升。文章结构如下:
第一章简单介绍了语音评测的发展背景与现状,重点阐述了语音评测的原理、系统构成、以及所依靠的语音识别技术基础,最后引入声调评测的概念,并分析其中存在的难点。
第二章基于声调评测系统的三个基本模块:特征提取、训练模型和评测算法,分别详细描述了其经典方法和原理。重点对比介绍了基于核心段建模和基于上下文信息建模的传统建模方法,分析其中的存在的问题,并提出新的方法。
第三章首先简单介绍了韵律方面理论的发展。根据对韵律理论的研究分析得知:韵律信息和语流中基频变化密切相关:韵律信息提供的各种层次的间断将连续语流分割成更加便于理解和机器处理的小单元,因此本文提出以韵律词为基本建模单元,建立基于多空间概率分布的HMM调型模型(L1Tone-MSD),可以较好地解决基频的不连续性和连续语流中上下文信息严重影响基频变化给建模带来的困难。实验证明该子系统针对标准发音的声调识别率和针对方言背景的非标准发音的声调评测结果都有较好的提升。
第四章提出了基于多种韵律信息的上下文相关的复杂声调模型(CCDTM)。实验结果表明,上下文相关的复杂韵律声调模型比传统的上下文相关的三音子声调模型性能更稳定可靠。CCDTM有效地反应声调在不同语境下的变化形式,并为韵律评测的研究工作提供了基础。最后将对全文进行总结,并指出将来的可能的改进方法。