电话信道下语言辨识技术研究

来源 :中国人民解放军信息工程大学 | 被引量 : 8次 | 上传用户:focus2316a
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言辨识(又称语种识别)技术是语音识别技术的一个重要方向,具有广泛的应用前景。语言辨识系统主要可分为三个部分,即特征提取、模型建立和判决规则。本文以OGI电话语料库为基础,对电话信道说话人无关的语言辨识技术和方法进行了研究,在特征提取、模型建立和前后端处理等方面提出了一些创新的见解,并应用到语言辨识系统。 在模型建立方面,本文主要研究了基于统计学习理论的模型方法,提出了高斯混合二元—全局背景二元模型(GMBM-UBBM),它是高斯混合—全局背景模型(GMM-UBM)的扩展模型。本文实现了基于GMM-UBM模型和GMBM-UBBM模型的语言辨识系统,新的二元语言辨识模型GMBM-UBBM模型保留了GMM-UBM模型的语言辨识性能,引入了GMBM模型二元时序信息的优点,通过两种模型的结合,解决了原始GMM-UBM模型中前后矢量统计独立的问题,新模型既保留了GMM-UBM和GMBM优点,也弥补了各自的不足。 在训练准则上,本文研究了GMM模型的区分性训练算法,分析了目前两种主要的区分训练准则——最大互信息准则(MMI)和最小分类误差准则(MCE),提出并构建了分别基于这两种准则的语言辨识系统。这两种算法都是以类间信息来改善模型间的区分性,其实现均采用了广义概率下降法。本文首次将区分性训练算法引入到语言辨识领域,因此详细给出了两种算法的理论分析和实现过程,并通过大量实验证明,区分训练算法可以较好地改善语言辨识系统的识别率。 在特征提取模块,本文将一种新的基于GMM模型区分性训练算法的特征提取方法应用到语言辨识系统。该方法将区分性的训练机制引入到特征提取过程,根据最小分类误差准则,通过调整MFCC的滤波器组参数获得新的特征。实验结果表明,基于新特征的语言辨识系统的性能优于基于MFCC参数的系统性能,提高了系统的语言辨识率。 在后端处理模块中,多分类器决策级融合作为提高分类器性能的一种手段,被越来越多的系统采用。本文从两个方面对决策级融合进行研究,其一是对四种融合方式,即等加权方式、对数等加权方式、普通加权方式和多分类器竞争方式进行研究,其二是最佳线性融合方式研究,并在CFM、MSE和CE准则的基础上,提出了一种新的融合准则,即MCE融合准则。实验表明,新提出的MCE准则获得了和CFM、MSE和CE准则相类似的性能。 在前端处理模块,本文将一种全新的物理学思想——超顺磁性聚类算法,引入到说话人聚类领域。超顺磁性聚类算法将聚类问题阐述为一个非均匀Potts模型的平衡性质的测量问题,即在某个温度范围内,数据处于超顺磁性相位,然后利用数据点之间的相
其他文献
在河道开展拦河闸、分洪闸、节制闸、泵站等水工建筑物施工,需要搭设围堰进行导流。介绍了高碑店闸工程的施工概况及工程场区的地质情况,根据现状地形、导流断面、水深、地质
采用不同电池结构组装成氢-溴储能单电池,进行恒电流充放电测试.通过分析电解性能、充放电循环性能和电池效率,研究了不同电池结构对电池性能的影响.结果表明,膜电极的CCM两
本文在野外工作和室内分析的基础上,利用系统聚类方法,对白银市中心区土壤养料肥力进行了聚类分析,以企为区域土壤管理、改良土壤、因地制宜地发展农业生产提供科学依据.
随着无线通信的普及,无线信道被大量的用户所复用,通信系统中各个用户信号的相互干扰和系统外部的干扰成为制约通信质量的主要因素之一。传统的抗干扰技术和用户隔离技术依赖
近年来,冲激无线电超宽带和空时编码引起了学术界的极大兴趣。冲激无线电超宽带具有的优势包括:增强的多址接入能力、低功耗低复杂度的基带处理以及短距离高速传输的潜能;而空时
摘 要:教师的任务是把每一个学生都领进书籍的世界,培养起他们对书籍的酷爱,同时,家庭教育和家长陪伴也是不可少。  关键词:兴趣;习惯;智力发展;阅读能力  不重视长期、大量的阅读积累是无法学好语文的。科学研究也表明,孩子的阅读量只有达到课本总阅读量的四五倍,才有可能形成语文能力;一个人拥有的词汇量和他的智商成正比。大量阅读是提高孩子能力,发展孩子智力的重要途径。  一、重视小学生阅读能力的意义在哪
目的探讨胫骨pilon骨折治疗方式的选择及其效果。方法回顾性分析自2002年10月至2006年10月收治19例胫骨pilon骨折患者,均采用外固定支架结合有限内固定手术方式,术后平均随访21
联想收购IBM的PC和笔记本业务,这个巨大的行业噱头引发的兴奋出奇地短暂。为联想欢呼的人们情绪跌落的幅度甚至超过了联想在股市下挫的幅度。联想和关心联想的人,都迅速地回归2
公钥密码基础设施(Public Key Infrastructure,简称PKI)是迄今为止解决信息安全问题诸多方法中最全面的一种解决方案,而证书状态信息分发又是大规模PKI系统实施中耗费成本最高