论文部分内容阅读
本文继承了课题组2007年开发的发音矫正系统rEcho V1.0的特点,采用错误趋势分组技术给学习者提供有针对性的发音改进建议;利用多种形式为学习者呈现多种发音相关信息帮助其掌握发音要领。同时,针对rEcho V1.0的不足进行改进,构建了rEcho V2.0,系统性能得到提升。本文的主要工作如下:
1、系统地对比目前应用最广的两大语音识别引擎HTK和SPHINX在汉语普通话识别上的性能,包括在5维基频特征下的识别性能。从二者中为rEcho V2.0选择语音识别引擎。
2、根据香港人在汉语普通话发音中的缺陷,选择易错的典型声韵母作为学习目标,仿照课堂语言发音教学,围绕其典型易错音设计系统的课程内容。
3、根据rEcho V2.0的课程内容设计语音识别器。引入声道长度归一化技术来降低人的声道长度不同对识别率的影响;引入错音共振峰合成技术,解决了错误语音很难采集的问题;利用录制的正确语音和合成的错误语音训练声学模型,采用错音网络识别技术在语言模型上加以约束,大大提高了识别性能。
4、编写用户界面,整合系统各功能模块。
5、设计完善的测试方案,验证了系统的有效性和稳定性。