论文部分内容阅读
目前文本无关话者识别系统在实验室条件下取得很好的性能,但在实际应用中,噪声的存在使得系统性能急剧下降。这是由于噪声破坏了干净语音的形态分布,造成训练和测试环境的失配。缺失特征方法将被噪声严重破坏的频段标记为缺失特征,通过在识别时丢弃缺失特征的评分或通过可靠特征估计出缺失特征来减小噪声的影响。论文主要研究加性噪声影响下,基于缺失特征重建的话者识别系统性能。
论文采用Mel滤波器组输出作为特征参数,针对噪声对不同特征子带的影响各不同,提出局部信噪比准则判断各个特征子带的可靠性,将信噪比小于阈值的特征称为缺失特征。论文采用改进的谱减法求不同子带的信噪比,通过实验得出最优的闽值。
为了利用不完整特征参数进行话者识别,目前常用的缺失特征边缘化方法在识别时丢弃缺失特征的评分,从而有效的减小了噪声的影响,但是该方法的特征参数局限于滤波器组参数而不能使用识别性能更好的倒谱参数。论文针对缺失特征边缘化方法的不足,提出缺失特征重建方法,利用帧内特征之间的相关性,由可靠特征估计出缺失特征,得到完整特征向量,然后转换成MFCC参数进行识别。
论文研究基于聚类的缺失特征重建方法,采用若干个聚类描述干净语音特征的分布,识别时首先判断每帧向量所在的聚类,依据聚类的统计信息和可靠特征得到缺失特征的最大后验概率估计。随后提出谱减和缺失特征重建相结合的方法,其中谱减法用于检测缺失特征,并增强可靠特征。实验表明相比缺失特征边缘化方法,该方法能显著提高噪声环境中话者识别系统的性能。
针对基于聚类的缺失特征重建方法在判断每帧向量所在聚类时出现的聚类错误,进一步提出基于高斯混合模型(GMM)的缺失特征重建方法,依据每个高斯分量分别重建缺失特征,最后为不同重建结果的加权平均,有效的提高了缺失特征重建方法的性能。另外论文实验分析了GMM的不同模型混合度对识别率的影响,给出相对最优的模型混合度。最后在不同信噪比的白噪声和F16噪声影响下的实验结果表明:该方法相对于基于聚类的重建方法,话者识别系统的性能有进一步的提高。