基于TANDEM的区分性训练在语音评测中的应用研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:qq635306700
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,以计算机辅助语言学习为代表的语音评测系统越来越多的运用在口语考试和语言教学活动之中,不仅提高了评分工作的公正性、高效性,保证了考试成绩的客观性,而且增强了教学反馈的及时性、准确性,激发了学生的学习兴趣。目前主流的语音评测系统采用的是基于MFCC特征的最大似然估计(MLE)建模方式。这套方法虽然成熟可靠,但也存在着诸如易受模型假设错误的影响、对模式的识别分类能力较差等缺点,从而制约了系统评测性能的进一步提升。因此,本文考虑引入区分性训练技术和TANDEM特征,分别在声学模型训练准则和声学特征两个方面对原有系统进行改进。本文的结构如下:   第一章概述性地介绍了语音评测技术的发展背景,较为详细地说明了语音评分系统和发音检错系统的基本原理和实现方式,重点阐述了语音评测的识别理论基础,包括声学特征、声学模型和语言模型等概念。   第二章首先通过对贝叶斯决策理论的叙述指出了传统的最大似然估计(MLE)准则存在的不足,在此基础上引入了声学模型区分性训练的思想。再经过对各种区分性训练准则的目标函数和参数更新算法进行推导和比较,将它们统一地纳入到一套训练框架体系之中。之后,文章又分析了语音评测系统的各种度量得分与不同区分性训练准则目标函数的对应关系,从而为区分性训练的建模方式在语音评测系统中的应用提供了理论基础。   第三章首先分析了HMM/GMM框架和HMM/ANN框架各自的优缺点,之后提出了一种综合了两者优点的特征变换前端处理技TANDEM方法,并将其应用到普通话发音检错系统中。TANDEM方法通过使用区分性训练的神经网络去估计音素级后验概率,经过一系列后续处理将原始MFCC特征转化为TANDEM特征,作为基于HMM统计模型的评测系统的输入,进而完成评分或检错的任务。实验结果证明,TANDEM方法使系统的检错性能有了较大的提升,结合MLLR等自适应方法的使用效果会更为明显。   第四章首先分析了TANDEM特征和区分性训练技术相结合的可能性,之后介绍了英文评分系统的架构、评分特征和系统性能度量。最后搭建了MFCC-MLE、TANDEM-MLE、MFCC-MPE、TANDEM-MPE四个系统,分别用Child测试集和Middle测试集在不同配置的系统上进行测试,实验结果证明,基于TANDEM的声学模型区分性训练技术是一种有效的切实可行的提高目前英文发音评测系统性能的方法。   第五章对全文进行总结,指出不足之处和改进方向。
其他文献
随着网络技术和计算机信息技术的飞速发展,人类社会已经进入一个全新的数字信息化时代。以数字媒介为载体的作品由于其具有获取容易、复制简单和传播迅速等优点,极大的丰富了
本文对基于OFDM技术的无线通信系统射频前端进行了理论分析与硬件实现。射频发射部分的主要任务是,产生调制载波信号,将基带部分传输过来的信号正交调制到目标频率,然后经过
学位
传统的人脸识别系统可以在样本充足的数据库上取得良好的识别性能,但使用样本稀疏或旧的数据库时识别率会大幅下降。这就需要一种可以针对这种较差条件数据库进行良好识别的学
在未来的无线通信领域,广泛应用于长期演进标准(Long Term Evolution, LTE)的多输入多输出(Multiple-Input Multiple-Output, MIMO)技术以其得天独厚的优势受到了越来越多的
通信信号的分类识别主要用于实现对通信电台的个体识别,从而为通信网络的组成提供进一步判定的依据。通信信号的分类识别依据对由于各电台硬件差异而附加在发射信号上的细微
大气散射光的偏振特性变化与大气环境的变化密切相关,因此光在大气传输过程中呈现出不同的散射特性,引起了光偏振特性的变化。本文在分析环境因素对大气散射影响的基础上,以
机顶盒EPG(Electronic Program Guide)功能能为用户实时提供全面的节目信息和定制服务,而DVR(Digital Video Recorder)功能能让用户将他们喜欢的数字节目录制到机顶盒内置的
近些年平面、超薄的超表面快速发展并展现出前所未有的光束调控能力,这将为集成电路、平面显示、超分辨率成像、数据存储、光学隐身、量子信息处理等诸多领域提供一系列性能更高、功能更强的新型超薄光学器件。因此,对超表面特性及其实际应用的研究具有非凡的意义。本文根据PB相位的相关理论并借助FDTD仿真方法重点研究了适用于圆偏振光的超表面的特性。具体研究内容如下:(1)提出一种由金属矩形开口共振环阵列组成的新型
随着通信技术的快速发展,针对实际应用中出现的通信手段过多,彼此相对孤立的问题,业界提出的一种信息服务技术解决方案:统一消息服务(UMS,UnifiedMessagingService),这种技术
学位
21世纪,随着数字信息技术、多媒体技术和互联网技术的进步与发展,数码相机和网络照片越来越接近人们的日常生活。这种由数码相机拍摄由电子感光设备获取然后通过数字化存储的