论文部分内容阅读
世界的发展日益更新,人们交流的区域也越来越广,随之带来的是语言学习的迫切需求。计算机辅助语言学习通过集成语音识别技术,将在语言学习中扮演日益重要的角色。但要更好的替代老师在语言学习中的作用,计算机必须能很好的给出语言学习者的发音反馈,这就首先要求计算机能够很好的评估学习者的语音,并进行分析。针对目前自动发音评估算法的缺陷和汉语发音评估的较少研究,本文主要集中在对针对普通话测试的汉语发音质量评估,建立汉语的语音识别系统,再通过改进的基于后验概率的自动评估算法分析普通话测试中的数据,并与普通话测试的专家打分进行相关系数的比较,分析性能。
本文的研究重点及主要成果有:
1.针对汉语语音特征的需要,采用5维的基频特征加入声学模型的方法,并用多空间概率分布的办法解决基频的不连续特性。将谱信息和基频信息同时进行声学模型建模,这样对于基频的评估也自动地加入了概率中,不需要分开处理。
2.分析人工专家评分的性能。虽然迄今为止公认的最具权威性的评分方式仍然是专家打分,但经过实验分析,专家打分并非100%可靠。毕竟采用人的主观分数,不同专家之间和同一个专家有一定的不稳定性。这也带来了自动评分的需求。
3.提出了两种基于后验概率的改进算法--一般性的段后验概率和基于混淆网络的后验概率的评估算法。分别采用实验室专门录音数据和普通话测试实际环境录音数据进行测试分析,实验表明,虽然算法还不能优于人工专家评估,但是相比于已有的发音评估算法有很大改进,而且在实际普通话测试录音环境中有一定的实用性。