说话人识别中的抗噪声技术

被引量 : 0次 | 上传用户:slow1223rabbit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前的说话人识别系统对纯净语音已经可以达到很高的识别精度,但实际环境中无处不在的噪声带来了训练模型和测试语音之间的失配,使得噪声环境中说话人识别系统的识别率急剧下降。因而抗噪声的研究是说话人识别系统实用的关键。抗噪声说话人识别的目的是尽量减小或者消除噪声所带来的训练模型和测试语音之间的失配,使得识别性能尽可能接近训练环境下的性能。噪声所带来的失配可以映射到信号空间、特征空间和模型空间,因此抗噪声的方法也可以从这三个空间来考虑。本论文的主要工作也是从这三个方面展开。在特征空间提出了一种改进的特征PL_MFCC,在模型空间提出了直接倒谱加权的GMM模型。并且将这两种方法和其他的有效的抗噪声方法如MMSE和Log-Add融合,研究和比较了多种融合方案。论文首先针对MFCC特征对噪声较敏感的缺点,用一个新的函数来代替MFCC提取过程中的log函数,从而提出了一种新的鲁棒的特征PL_MFCC,并且和语音增强方法相融合。实验结果表明,PL_MFCC系统,PL_MFCC与语音增强的融合系统都可以有效提高低信噪比中的系统性能。而且PL_MFCC和MMSE的融合系统效果最好。根据各维特征鉴别能力的不同,在识别时直接对各维特征加权,提出了直接倒谱加权的GMM,并将其和MMSE融合,从而进一步提高了噪声中的识别率。论文最后还研究和比较了几种融合方案,包括MMSE和Log-Add的融合方法MMSE+LA,Log-Add和直接倒谱加权GMM的融合方案LA+CW,MMSE、PL_MFCC和直接倒谱加权GMM的融合方案MMSE+PL+CW。实验结果表明,LA+CW 和MMSE+PL+CW 可以显著提高系统性能。
其他文献
抵押担保横跨物权法与债权法两大领域,被人誉为“担保之王”。抵押权制度是抵押的核心内容,对于保障债权的实现及债务的履行,增强主体的信用,预防和减少不必要的交易风险,发挥着十
《小说月报》是清末民初的一份小说杂志,隶属于商务印书馆。本文由此出发,研究它和近代上海都市化的关系。这里有两个层面的含义:一是小说杂志和上海城市文化的关系,二是小说
本文探讨了时域匹配积分预报方法中,自由面网格和线性自由面条件的数值处理方法的适配问题。 对于大多数的船型,单一和自由面网格形式不可能精确的描述船体周围的流场,而各种
在人类人口数量不断增多与社会生产力发展水平不断提升的大背景下,人类对资源需求量逐渐增大。加大对资源的有效保护、在实际生活中减少能源的消耗是社会稳定发展的关键。装
正数学能力在形成人类理性思维的过程中发挥着独特的、不可替代的作用.高中数学的学习是一个发现新知识、巩固旧知识的长期积累过程.数学学科的特点是具有一定的逻辑性、抽象
论文分析了高职工程造价专业的现状,提出根据社会需求深化人才培养模式,创新课程体系和教学改革,坚持工学结合模式的建议,力图为高职院校工程造价专业探索一条持续发展的专业
安东尼·高迪(Antoni Gaudi),1852年月25日生于西班牙加泰罗尼亚省雷乌斯的一个铜匠家[41]。巴塞罗那被称为“属于高迪的城市”,提起高迪会让人想起巴塞罗那,而说起巴塞罗那
企业内部控制是完善公司治理的核心内容。企业资源计划系统(Enterprise Resource Planning System)在企业中的应用,给内部控制体系带来了若干冲击和推动。本文通过对电子数据
采用企业调查和现场监测相结合的方法对佛山金属表面处理行业的VOCs排放特征进行了研究。结果表明,该市金属表面处理行业使用的原辅材料种类较多,成分复杂,共检出86种物质,VO
成体干细胞的发现及其诱导分化为神经细胞的研究为人类及动物神经系统各种疾病的治疗和损伤的修复开辟了一条新途径。为了寻求一种自体取材方便、安全有效的可用于诱导分化为