说话人辨认中的特征变换和鲁棒性技术研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户：kbens

【摘要】

：

为了提高说话人辨认系统的性能和在实际应用中的鲁棒性,本论文在高斯混合模型特征变换、特征加权补偿变换和自适应直方图均衡化三个方面进行了研究,主要研究成果包括:1.提出

【作者】

：

徐利敏

【出处】

：

南京理工大学

【发表日期】

：

2008年期

【关键词】

：

说话人辨认特征变换多步聚类加权特征补偿变换自适应直方图均衡化噪音鲁棒

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了提高说话人辨认系统的性能和在实际应用中的鲁棒性,本论文在高斯混合模型特征变换、特征加权补偿变换和自适应直方图均衡化三个方面进行了研究,主要研究成果包括:1.提出了基于嵌入变换的对角方差矩阵高斯混合模型的多步聚类算法。为了简便计算,高斯混合模型中的方差矩阵通常直接用对角方差矩阵代替,因而会对相似度的计算产生损失。为了弥补由于采用对角方差矩阵而引起的相似度损失,提出了基于嵌入变换的对角方差矩阵高斯混合模型的多步聚类算法。该方法采用嵌入变换的对角方差矩阵来建立模型;同时将多步聚类算法融入其中,使高斯混合模型能找到其最适合的模型混合数。与普通聚类期望最大(EM)算法相比,多步聚类算法所需的EM估计次数明显减少;与聚类EM估计的GMM方法相比,在同一语音库下平均计算时间降低了约50%,错误识别率平均减少1.4%;在自制和公开的两个语音库下,与嵌入变换的GMM估计方法相比,新方法都可以直接达到说话人辨认错误识别率的最佳点,达到了识别效果和识别时间的统一。2.提出了基于高斯混合模型的加权特征补偿变换的抗噪声算法。针对特征加权算法的局限性和归一化补偿变换方法的特性,提出了基于高斯混合模型的加权特征补偿变换的抗噪声算法。一方面根据帧信噪比对特征值的贡献大小进行加权;另一方面根据说话人识别的声学特性对模型输出的似然得分进行变换,补偿了加权因子在某些环境下的局限性。对于不同信噪比的平稳和非平稳噪声环境,在自制语音库下,与特征加权算法相比,该算法平均识别率提高了2.74%和2.82%;与归一化补偿变换方法相比,平均识别率提高了3.56%和1.34%。在另一公开语音数据集下,与特征加权算法相比,该算法平均识别率提高了3.02%和2.56%;与归一化补偿变换方法相比,平均识别率提高了3.9%和1.14%。3.提出了基于统计模型的自适应直方图均衡化方法。针对说话人特征的统计特性和直方图均衡化在说话人识别中应用的不足之处,提出了应用于说话人辨认中的自适应直方图均衡化方法。该方法首先用较大的区间长度来构造直方图的累积函数,然后根据各区间内特征值频率增量的大小来自适应确定该区间是否需要再划分以及划分的程度。采用这种方法不仅使计算量降低,而且得到的变换特征值的分布更符合实际特征空间,从而进一步提高了噪声环境下说话人辨认系统的识别率和鲁棒性。在同一测试集下,研究两种常用经典噪声(即White和Babble),与普通直方图均衡化方法相比,自适应直方图均衡化方法的平均识别率分别提高了3%和2.9%。在另一公开对比测试集中,该方法的性能同样有相似的提高。

其他文献

20多年来香港政治生态的改变

1980年代以来,香港的政治生态发生了根本性的改变.这种变化突出表现在从单向度政制到多维政制的转变,从"无政党的行政国"到政党政治的转变,从非参与的政治文化到参与的政治文

期刊

政治生态政制政党政治参与政治民主

涡轮增压发动机进气噪声控制分析

针对某涡轮增压发动机进气系统,利用GT-POWER软件进行进气系统噪声建模仿真,分析其进气噪声总值,确定降噪频率段.针对降噪频率段,利用赫姆霍兹共振原理设计一组共振腔消声器,

期刊

赫姆霍兹共振腔消声器共振频率GT-POWER涡轮增压发动机

澳对外国投资更加谨慎,尤其是国有企业的竞购

中国正在许多发达经济体对地产、农业和公共基础设施资产掀起一波投资热潮.过去两年,澳大利亚首都堪培拉方面已逐步收紧外国投资规定,而且正在拟定一份基础设施投资新规.澳大

期刊

外国投资国有企业公共基础设施基础设施投资澳大利亚发达经济体投资规定投资热

中盐公司肖祥立同志职务变动情况

国务院国资委网站10月14日消息称,经研究,中国盐业总公司纪委书记肖祥立同志一年试用期已满,现予转正,任职时间自2015年7月起计算.

期刊

盐业总公司变动情况同志职务纪委书记任职时间国资委国务院

钢材金相图像晶界提取算法研究及智能评级软件设计

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

学位

金相图像双边滤波Mean Shift随机森林晶粒度

脉冲超宽带网络接入控制

IR-UWB(Impulse Radio-Ultra Wide Band)技术是无载波的脉冲通信技术，发送的脉冲宽带极窄，系统的占空比极低。为了使脉冲均匀的分布在时域上，IR-UWB系统一般采用跳时序列控制脉

学位

IR-UWB跳时多址MAC设计脉冲碰撞

波长转换条件下波长路由光网络性能研究

从1990年提出全光网概念，到密集波分复用技术全面商用，光通信技术的迅速发展已使全光传送网络技术成为下一代互联骨干网上唯一可选的网络技术。波长路由光网络作为目前比较成熟

学位

波分复用波长路由光网络波长转换阻塞性能路由波长分配组播

沙蟒（Eyyx miliaris）呼吸,消化系统的解剖及扫描电镜观察

本文报导了关于5条沙蟒的呼吸、消化系统解剖研究的结果:呼吸系统由鼻、喉、气管、肺组成,右肺较左肺发达,左肺退化,其长度约为右肺的41.5%。消化系统包括口腔、食道、胃、小

期刊

沙蟒解剖消化系统电镜呼吸系统anatomyrespiratory systemdigestive systemdigestive glands

小议增值税的项目设计

摘要：增值税作为我国最大的税种，其收入占我国全部税收的60%以上。掌握增值税的税理、计算、申报、核算，成了会计专业学生的基本技能，对于具备初步自学能力的高职生来讲，教材是最好的老师。该文就《会计基础》、《税法》、《财务会计》等教材对增值税内容的编排和论述应如何适应项目教学和学生自学做了一个简单论述。　　关键词：增值税;应交税费;教材;编排　　中图分类号：G618.5 文献标志码：A 文章编

期刊

增值税应交税费教材编排

初中数学差异教学模式的探索与实践

随着“以人为本”的教育理念不断深入人心,差异教学也越来越受到广大教育工作者的重视.通过对初中数学教学的探索与实践,文章提出了“备生预异”“疑生启异”“跟生导异”“

期刊

教学模式备生预异疑生启异跟生导异拓生展异

说话人辨认中的特征变换和鲁棒性技术研究

与本文相关的学术论文