复杂环境下说话人确认鲁棒性研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:okyshishuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对说话人确认系统的鲁棒性进行了深入研究,论文主要工作包括:1.针对跨信道问题,提出了基于频带加权的特征提取算法,研究了其在不同数据集及基于i-vector的说话人确认系统的推广性。本文依据F-ratio准则估计梅尔频带在跨信道说话人确认任务中的频带区分度,依此进行频带加权,得到修正的MFCC提取算法;分析了F-ratio的区分性监督学习与i-vector全变量空间映射矩阵的非监督学习之间的差异,采用LDA区分性模型将F-ratio在特征域的说话人信息突显出来;研究基于i-vector的说话人确认框架下F-ratio方法在不同数据集合下的可扩展性。在2008年NIST核心评测集上的实验表明,相对于传统MFCC特征,基于频带加权的修正的MFCC特征在NIST核心评测的8种测试条件下均有不同程度的提高,在核心评测全集上的EER相对下降达12.2%。2.提出了基于DNN区分性训练的说话人确认方法。本文首先研究了DNN区分性训练数据集的筛选准则;提出采用i-vector的余弦度量和对应维度的幅值差值距离作为DNN区分性训练的输入,在说话人i-vector空间中构建基于DNN的区分性训练;最后,考虑到区分式模型与产生式模型的互补性,提出将PLDA模型与基于DNN区分性训练方法进行融合。在2008年NIST核心评测集上的实验表明,相对于i-vector+PLDA的基线系统,基于DNN区分性训练的方法在NIST核心评测8种测试条件下均有不同程度的提高,在核心评测全集上的EER相对下降达11.8%。3.提出了基于顺序自适应的模型动态更新算法。针对测试环境发生变化时说话人确认系统性能会大幅下降的问题,提出了基于MAP的GMM-UBM顺序自适应算法。通过控制MAP中先验度的大小,学习新环境下测试语音中包含的信道信息和说话人信息,实现模型的动态更新;进一步,在MLLR特征空间映射的基础上提出了基于f MAPLR的特征空间连续自适应,并与基于MAP的GMM-UBM顺序自适应相结合,提出了基于MAP-f MAPLR的顺序自适应算法。本文选择了两种不同的初始UBM,在CSLT-Chronos数据库上开展测试环境变化的模拟实验。实验表明,基于MAP-f MAPLR的上述两种顺序自适应算法的EER分别相对下降25.0%与39.0%。
其他文献
针对碱度大、COD高、组成复杂的碱减量-印染混合废水。采用高碱度下直接混凝再酸析相结合的方法进行预处理,取得理想效果。试验结果表明,在高碱度条件下先加入镁盐及少量高分子
目的探讨严重创伤后并发胆囊坏疽的临床诊治方法。方法回顾性分析2例严重多发伤后坏疽性胆囊炎的临床资料,并结合文献分析创伤后并发胆囊坏疽的相关危险因素和临床诊治方法。
引言:激烈的市场竞争和时代的发展,要求国有企业对干部的履职能力提出更具体、更严格、更全的要求.同时,国有企业的干部培养工作也要集思广益,从思想上开始学会转变,树立良好
期刊
目的探讨沙眼衣原体(CT)感染与男性不育的关系。方法选择来自我院男科门诊的365例男性不育患者作为观察组,正常生育男性98例作为对照组,留取首段尿标本,应用连接酶链反应(LCR)法检测
针对目前国产水稻联合收获机割台参数调整依赖于经验手工调节、操控不方便等问题,该文设计了水稻联合收获机割台参数按键调节装置,提出了拨禾轮转速自动控制方法,建立拨禾轮
目的探讨性病患者的心理问题及相应的护理干预措施。方法选取2010年5月-2012年12月无锡市疾病预防控制中心门诊部收治的性病患者76例,随机分为两组,分别进行常规护理和增加心
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
海洋环境对人类经济活动以及国防建设的影响巨大,尤其是在人类活动频繁的近海海域。对近岸海洋环境进行实时有效地监控,能够避免不良的海洋环境对海岸线经济造成损失,同时可
随着社会信息化进程的持续快速发展,人们对无线通信的需求与日俱增。一方面,不断提升的无线通信需求对无线通信性能提出了更高的要求。另一方面,无线通信系统性能的进一步提
21世纪是信息大爆炸的时代,迅猛发展的英特网对通信网络的通信容量的要求越来越高。全光信号处理技术有望在光网络节点克服传统光-电-光交换模式对速率的制约而被广泛地研究