基于信道补偿技术的说话人确认研究

被引量 : 0次 | 上传用户:tgb567_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与文本无关的说话人确认是说话人识别领域的主要研究方向之一。近年来,随着计算机、便携设备计算能力的增强,以及说话人识别技术的快速发展,说话人识别体现出了很好的研究价值,开阔的应用前景。因此,对说话人确认技术的研究,具有十分重要的现实意义。主流的说话人确认系统都是基于概率统计模型实现的。概率统计模型能够很好的描述说话人声学特征在特征空间的统计分布特性,因而能在说话人确认中取得十分不错的效果。但由于背景噪声以及信道失配等问题的影响,导致了说话人确认系统的性能难以进一步提升。本论文围绕说话人确认的模型域补偿方法,以通道失配、区分性训练为主题,分别基于GMM-SVM模型,全变量空间模型、以及G-PLDA模型对说话人确认技术进行了研究。本文主要研究的内容有:首先,将广泛使用于计算听觉场景分析中GFCC特征应用于说话人确认中,并对GFCC做出了一些改进,如在特征提取过程中采用开根号10压缩替代取对数压缩;在提取特征时使用26通道Gammatone滤波器组而不是64通道。实验结果表明,使用26通道Gammatone滤波器组的提取的GFCC能取得更好的性能。基于开根号10压缩的GFCC特征效果明显优于当前系统的PLP、MFCC特征。接着,构建了GMM-SVM说话人系统,在对声学特征参数进行PCA变换后,经过GMM建模,然后用SVM进行区分性训练。提出了一种能更充分利用GMM模型中的说话人信息构建SVM输入向量的方法。实验结果表明,该方法确实能在一定程度上提升系统的性能。最后,分别构建了基于TV模型和G-PLDA模型的说话人确认系统,并结合whitening规整、长度规整、LDA变换和WCCN变换等方法来对I-vector做信道补偿,并深入分析了这些信道补偿技术对实验结果的影响。并提出了在whitening规整和长度规整后,进行LDA或G-PLDA变换能使I-vector系统的性能大幅提升。
其他文献
宋蒙战争爆发以后,蒙(元)军队与南宋军队在四川展开了持续近半个世纪的战争。蒙哥时期,钓鱼城依托四川的宋军山城防御体系,有效发挥了其重庆北面屏障的功能,1258-1259年的钓
随着现代教育技术的发展,媒体技术的形式也不断被丰富。可以说,在教学观念上和教学手段上,都有了很大的改观。但是仍然存在着一定的不足,例如:不重视实验教学;轻视化学史实在化
我国电子商务从20世纪90年代发展至今短短十多年,已经渗透到各行各业中,先后出现许多成熟的商业模式。2010年Alex Rampell提出了O2O概念,O2O就是顺应电子商务发展趋势而产生
外汇储备作为一国货币当局可随时利用的对外资产,在一国国际交往中具有重要作用。我国经过改革开放后三十多年的努力,逐步发展成为世界第一储备大国。但是,金融危机后,美国经
硬度是硬质合金最为重要的性能参量之一,其与组织结构之间的关系密切。许多研究者研究了硬质合金硬度与组织结构的关系并建立纯经验的或者基于合金塑性形变的理论模型。对WC-C
锅炉屏式过热器爆管是热电厂锅炉出现的主要事故之一,了解屏式过热器爆管事故的原因,搞清受热面管道失效的机理,并提出预防措施,减少屏式过热器爆管的发生是当前的首要问题。
随着社会进步及人类文明程度的不断提高,汽车正以大众化消费品的姿态进入百姓生活,有车族将更加注重汽车文化的享受。我国城镇居民已经开始从汽车代步时代向享受汽车文化的时
交通运输的快速发展给人们生活带来便利的同时,也给生态环境带来了严峻的挑战。如何实现运输环境的净化,运输与物流的可持续发展,运输资源的充分利用,运输效率的有效提升等是
目的:研究住院患者、肠道门诊腹泻患者、健康体检者三个不同人群肠道中肺炎克雷伯菌的携带状况、毒力基因、耐药性及其分子流行病学特点。方法:采集三个目标人群新鲜粪便标本接
说话人识别是一项根据说话人的声音信号提取出表征说话人个性的特征参数来自动识别说话人身份的生物认证技术。因其独特的方便性、经济性、准确性,被广泛应用在信息安全、通