低信噪比环境下说话人识别研究

来源 :苏州大学 | 被引量 : 4次 | 上传用户:fffdsa4te
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是一种利用语音信号来验证身份信息的生物识别技术。现实中,说话人识别系统受制于语音中的噪声,系统的识别性能降低。说话人识别朝着商业应用发展,并且在噪声较强环境下的说话人识别正成为研究热点。而现有的技术在强噪声的低信噪比环境下,性能大幅下降。这对说话人识别提出了新的要求。目前低信噪比环境下的说话人识别存在三个待解决的关键问题。1.现有的说话人识别特征参数,在低信噪比的环境下,其自身鲁棒性急剧下降,无法满足说话人识别对特征参数的要求。2.在低信噪比环境下,现有的特征补偿方法性能下降,无法有效地提高特征参数的鲁棒性。3.现有说话人识别模型在低信噪比环境下性能降低或只能针对某类特殊噪声鲁棒性较好。论文在对噪声环境下的说话人识别进行深入研究的基础上,对于以上三个待解决的关键问题,分别研究了低信噪比环境下的鲁棒特征参数、特征补偿和识别模型。主要研究内容和创新点如下。1.针对低信噪比噪声环境下,说话人识别的特征参数鲁棒性下降的问题,论文提出感知语谱规整耳蜗滤波倒谱系数的特征提取方法。方法先构建符合耳蜗基底膜行波冲激响应及非线性频率分布的耳蜗滤波器组,使特征参数的提取过程在频域中拟合心理声学实验结果从而提高特征参数的鲁棒性。再由人耳感知特性的语音增强以及一个时-频域的二维增强,通过二维数据的边界检测得到感知语谱规整参数。并把耳蜗滤波器组的输出进一步规整为时-频域鲁棒性更好的感知语谱规整耳蜗滤波倒谱系数。实验结果表明,在所有测试的信噪比条件下,论文提出的特征参数,在所有实验噪声中的平均识别率,分别比另外三种特征参数高出26.6%,22.2%以及18.5%,而在-10d B到10d B的信噪比条件下,提出的特征参数在所有条件中获得了最好的识别率。在低信噪比条件下,提出的感知语谱规整耳蜗滤波倒谱系数对不同噪声都具有相对较好的鲁棒性。2.针对低信噪比说话人识别中特征补偿方法鲁棒性下降的问题,提出了一种采用感知听觉场景分析的特征补偿方法。先求取语音的缺失数据特征谱,并由语音的感知特性求出感知特性的语音含量。含噪语音经过感知特性的语音增强和对其语谱的二维增强后求解出语音的分布,联合感知特性语音含量和缺失强度参数提取出感知听觉因子。再结合缺失数据特征谱把特征补偿的过程分解为不同听觉场景进行区分地分析和处理,从而增强特征参数的鲁棒性能。实验结果表明,在-10d B到10d B的低信噪比环境下,对于四种不同的噪声,提出的方法比另外五种方法的鲁棒性均有提高,平均识别率分别提高26.0%,19.6%,12.7%,4.6%和6.5%。论文提出的方法,是一种在时-频域中提高语音特征鲁棒性的方法,更适合于低信噪比环境下的说话人识别。3.针对低信噪比说话人识别中模型鲁棒性下降的问题,提出了一个混合条件噪声场模型。它通过分数阶离散转移函数,把White噪声作为基噪声,Pink噪声作为指导噪声,构建了一个从白噪声到棕色噪声渐变的一系列有色噪声。并且以不同的信噪比加入到训练语音中,然后构建一个拥有各种噪声条件和各种信噪比条件的混合条件噪声场。再对混合条件噪声场中的每个说话人语音都构建模型,形成混合条件噪声场模型。识别时先在混合条件噪声场模型的每个说话人模型中找到匹配的混合条件噪声场模型,再在所有说话人中识别出说话人。实验结果表明,在所有的四种实验噪声中,提出的模型在-10d B到10d B信噪比下的平均识别率,分别比基线模型和另外两种参考模型高出42.7%,32.2%以及21.1%。提出的说话人识别模型更适用于低信噪比的环境。
其他文献
在壳聚糖的生产过程中 ,将稀碱脱蛋白阶段反应后的稀碱 ,添加 8%— 1 0 %的稀碱后可重复使用 ,如此反复回用 3次 ;而浓碱脱乙酰基阶段反应后的浓碱 ,添加 5 %左右的浓碱后可
介绍了近年来聚酰亚胺的发展现状、性能及在各个领域的应用,论述了聚酰亚胺的最新研究成果,指出了其今后发展方向。
在科学与技术飞速发展的今天,人们的生活水平在不断提高,但各种"富贵病"也随之而来。尤其是越来越多的年轻群体中出现了新陈代谢功能与心理状况低下的症状,陷入了亚健康的状
通过对《杨振宁演讲集》的研读,笔者认为,杨振宁教育思想主要表现为:培养与笼络并重的人才思想,反对读死书、随时向新的方向发展的基本思路。其科研思想主要表现为:抓要害、注重实
高吸水性树脂(简称SAR)是一种典型的功能高分子材料。它能够吸收自身重量几百倍至千倍的水分,无毒、无害、无污染;吸水能力特强,保水能力特高,通过丙烯酸聚合得到的高分子量聚合物
本文从Fluent软件在动量传递,Exchanger Design and Rating软件在热量传递和Aspen Plus软件在质量传递3个方面介绍了通用化工软件在《化工传递过程原理》教学中的应用,形象地
蔬菜的生产流通关系着人们的切身利益,蔬菜营销渠道正成为学者们研究的重。目前我国蔬菜营销渠道存在营销主体分散、竞争力弱,营销渠道保鲜技术、基础设施和组织建设落后的问
随着多媒体信息技术的快速发展,网络语音资源呈现出了爆炸式地增长,因此如何利用语音进行分类和识别具有重要的意义。说话人识别技术可以利用少量声音数据区分说话人,从而实
自热高温好氧消化是一种有效并且实用的污泥稳定技术,它的处理效率高、构筑物所占用的体积小,适用于处理量较小(≤20 000 m~3/ d)的中小型污水处理厂。自热与预热自热高温好
随着隔震技术的快速发展,现在越来越多的建筑物都运用了隔震技术,而运用最多的是基础隔震。基础隔震是通过在建筑物的上部结构和基础间设置隔震层,目的是为了阻止地震能量向