论文部分内容阅读
随着中国改革开放的不断深入和经济的高速发展,学习普通话、参加普通话水平考试的人员越来越多,对计算机辅助普通话学习系统和普通话水平自动评测系统的需求越来越迫切,这些需求导致了普通话水平客观测试方法研究的兴起。普通话水平客观测试系统不但能为普通话学习者提供及时的语音正误的反馈信息以提高学习效率,还能使大量的普通话测评员摆脱沉重的劳动负担,同时提高普通话水平评测结果的客观性和公正性。本文针对普通话水平客观测试研究用语音数据库的建立、普通话声调和轻声的客观评测、普通话声母的客观评测等问题进行了详细的分析、研究,主要研究内容和成果如下所述:
第一,建立起由标准语音数据库和测试语音数据库构成的普通话水平客观评测用语音数据库。首先,通过统计分析《新华字典》《现代汉语词典》和“普通话水平测试用普通话词语表”,制定了标准语音数据库的词表构造原则和词表选取原则,构造出覆盖“普通话水平测试用普通话词语表”中的语音组合的平衡词表。录制了130小时的标准语音数据和22小时的测试语音数据,并对这些语音数据分别进行了标注。
第二,在端点检测判定方面,提出了借助普通话水平测试的特点,综合利用功率谱方差和teager能量等参数进行端点检测的算法,得到了98.5%以上的端点检测精度。在音节切分方面,在充分利用普通话水平测试试卷的文本信息、同一人的声母时长在常规语速下基本稳定、同一人的声母之间以及韵母之间的相对时长基本保持比例关系等先验知识的基础上,使用经小波变换后再重构的3个语音信号分量的累计能量特征为参数,提出了利用话者语音统计信息的两级音节切分算法,使音节切分精度达98.3%以上。
第三,在详细分析普通话声调特点的基础上,提出了普通话声调的客观评测方法。提出了能消除语速影响和音节间相互影响的声调建模方法,选择了能反映声调特点的5个基频比值与归一化的基频共同作为声调评测参数,利用高斯混合模型对来自测试语音数据库中的60人的实测语音数据进行了测试,结果表明:客观测试同主观测试的符合率达到88.24%。
第四,根据普通话轻声的特点,设计出普通话轻声的客观评测算法。提出了能反映人的听觉特性的基频归一化算法,选择了能反映轻声特点的7个语音特征作为评测参数。利用高斯混合模型和多层感知器模型对43人的数据进行了测试,结果表明:客观测试同主观测试的符合率达到89.19%。
第五,通过罗列分析声母读音错误的主要原因,提出了利用语音知识引导的两层两级声母客观评测算法。根据普通话声母的特点,总结出98种普通话声韵组合作为声母的评测基元。试验结果表明,所提出的算法比单独用HMM算法评测的主客观符合率高2.56%,比单独用BP神经网络算法评测的主客观符合率高3.65%,比只用单层算法评测的主客观符合率高1.42%,证明该算法不但能减少计算量,还能提高评测的精度。