【摘 要】
:
本论文研究的是针对新疆非母语说话人语音数据集的发音错误检测技术,众所周知,发音检错技术是计算机辅助语言学习系统性能的重要体现,如何提高新疆非母语说话人汉语普通话发
论文部分内容阅读
本论文研究的是针对新疆非母语说话人语音数据集的发音错误检测技术,众所周知,发音检错技术是计算机辅助语言学习系统性能的重要体现,如何提高新疆非母语说话人汉语普通话发音错误检测系统的性能对广大少数民族汉语学习者意义重大。文中以新疆维吾尔族说话人语音数据库为例,利用少量的新疆非母语说话人的语料,通过对传统发音错误检测声学模型的改进和训练,得到了能够有效提高发音检错系统性能的区分性训练算法。本论文的主要工作如下:首先,本文简单介绍了常用的发音错误检测度量归一化对数似然比(Goodness of Pronunciation,GOP)算法以及评判系统检错性能的重要指标F1值计算方法。还重点介绍了最大似然估计(Maximum Likelihood Estimation,MLE)训练准则,对新疆非母语语音库进行MLE训练,并计算出其检错声学模型的F1值,为对比本文所提出检错算法的有效性奠定了基础。其次,将传统语音识别中的区分性训练准则应用到发音错误检测系统中,通过对常用区分性训练算法的分析,选择了应用较为广泛的最小音素错误估计训练准则(Minimum Phone Error,MPE),并用实验验证了 MPE区分性训练准则可以有效的提高对检错数据的音素识别率,但对提高系统检错性能的帮助并不大,说明现有的区分性训练准则并不能有效的提高发音错误检测系统的性能。最后,本文在MLE、MPE声学训练模型分析的基础上,提出了以最大化F1值为目标函数的区分性训练准则(Maximum-score Criterion,MFC),通过建立经过专家标注过的新疆非母语说话人语音数据库,构造出最大化F1值的目标函数,并提出了采用构造弱意义辅助函数的方法对目标函数进行优化及参数更新,通过采用阈值迭代更新的方法确保了目标函数随迭代次数的不断提高而增长。该区分性训练算法能够根据新疆少数民族发音数据库的人工标注结果自动学习专家的发音错误评判标准,实验结果表明该方法能够有效的提高发音错误检测系统的性能。
其他文献
近年来,基于声音的室内定位技术与智能移动终端兼容性好、且成本低成为室内定位最有潜力的解决方案。而室内环境多样且复杂,非视距现象普遍存在,难以实现高精度定位,通过非视距识别及处理可以提高其定位精度及稳定性。因此,本文基于声信道特征,利用半监督及无监督在线学习方法突破非视距识别的技术瓶颈,为该领域提供新的方法。本文主要研究内容及贡献点如下:(1)基于相对增益及时延估计,将视距与非视距路径下声信道差异进
核电站运行过程中,燃料会发生一系列俘获反应进而生成超铀元素(TRU)。这些核素比铀元素的原子序数大,主要包括钚、镅、锔、镎等元素,所有这些高放射性锕系元素都具有很长的半
随着因特网网络速度的不断提高,用户对WEB应用的体验要求也越来越高,催生了Flash的广泛应用。因为其动画的特性,配合flex程序可以理解为一种程序语言,编译完成后即我们常见的
公路是经济发展的重要基础设施,修建高等级公路,完善国家公路网对于国家未来发展至关重要。然而公路对自然又是一种扰动行为,随着人们环保意识的逐渐增强,公路建设过程中环境保护的重要性逐步被认识。公路穿越湿地将对脆弱的湿地自然生态系统造成波动。本文概括介绍了建虎高速及挠力河保护区的基本情况,并从几方面分别阐述公路建设对湿地系统的波动影响,并针对这些不利影响提出湿地保护措施。公路对湿地的影响有以下方面:占用
英镑是国际可自由兑换的主要货币之一,随着经济全球化的发展,英镑纸币的流通量日益增大,增强英镑的鉴伪能力成为了金融机具的迫切需求。在现有的金融机具中,图像鉴伪是一项基
文物信息资源记载了文物在出土、保护、管理和利用过程中的各个状态,是追溯人类文明发展的重要参考资料。但目前文物信息资源的组织和利用程度较低,大多停留在数字化阶段,对其组织多是从外在状态进行单一维度的描述,不同机构表达和存储资源的形式不同,导致异构、多源的文物信息资源无法得到广泛地共享和充分利用,用户获取文物信息资源的迫切需求与资源开发利用程度低的矛盾不断凸显。关联数据的提出为信息资源的融合提供了一种
随着经济的发展、社会的进步,人类生产及生活对能源的需求越来越旺盛。传统能源的供应已经严重满足不了经济社会发展的需要,成为制约我国经济社会发展的重大障碍。因此,必须
电阻抗成像技术是在20世纪末才发展起来的一种新型成像技术,其原理是在被测对象边界周围按一定规律安放若干个电极,以非侵入的方式测量被测对象的边界电信息,然后利用特定的
擦窗机是一种机电一体化和特种非标产品的高空作业设备,广泛应用于高层及超高层建筑物或构筑物外墙立面或采光屋面维护、清洁和装修等作业情况。伸缩臂作为擦窗机最重要的承
金属网面是空间可展开卫星天线的关键材料,网面材料的物理、化学、机械性能和稳定性直接决定着星载卫星天线的使用性能和寿命。国外早就开始对这种网面材料进行开发研究,至今