论文部分内容阅读
近年来我们国家出台了一系列的政策加大推广普通话,越来越多的人报名参加普通话水平考试。通过对普通话水平考试现状的调查和分析,针对目前普通话水平考试面临的一些困难。于是,我们研发出了一种用于考试的网络系统,此考试系统用来对语音(普通话)进行测试。
语音识别技术有两个作用:一是对受试者的发音(汉语)进行识别,二可以对发音的精确程度进行测量,进而可以根据测试者所掌握汉语的发音的水平计算出发音的准确度;语音评测技术根据发音的准确度给出测试者的普通话等级。
本论文包括以下内容:
(1)我们分别采集了七个男生和七个女生的语音数据,内容主要有一百二十个汉语常用孤立词、四百五十个带调音节以及三百个汉语单字的语音语料。
(2)在语音评测模块中,我们建立了一个随机的语音识别的系统,经过改进,其识别的准确率达到了百分之九十六,基本符合用于实际的要求。我们建立该系统时借助了HTK平台,并对语言的模型、混合高斯模型以及基频参数等进行了优化改动。
(3)在语音评测模块中,我们使用了机器评分以及参考置信度的两级评分机制。首先,使用Vitcrbi最优状态序列搜索算法进行时间对齐,将标准语音数据和测试语音数据运用HMM对数似然值、音量强度、归一化声学参数、切分时长和基频这五种评测指标的加权和通过模板匹配的方法进行语音评测评分。其次,由于句子层以及音子层发音置信度的评价标准不一样,所以对发音进行测量时参照的依据也不一样,针对上述问题,我们参考了统计假设检验的一些理论,然后我们又分析了词格密度、尺度似然、每帧熵以及后验概率等置信度指标之间的联系。
(4)设计了一个融合了语音识别和语音评测技术的针对普通话水平测试的考试系统;并且考虑到了本地测试者和远程测试者的不同的特点。实现了便捷、准确的考试系统。