噪声环境下的基于GMM/SVM说话人识别算法

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:wuyu9603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言是人类最重要的交流工具,语音信号作为语言载体在不同的层面包含了大量的信息。其中与说话人相关的信息可以辨认说话人是谁或者确认此说话人是否为某特定的人。如今自动说话人识别技术在低噪声、低失真环境下的识别率已经相当的高,但实际环境中无处不在的噪声导致了训练模型和测试语音之间的失配,这使得噪声环境中说话人识别系统的识别率急剧下降。因此提高噪声环境下说话人识别系统的性能是说话人识别系统从实验室走向实用的关键,也是当前的研究热点。说话人识别技术主要包括特征提取和模式识别两大模块,本文分别从人的发音器官和听觉器官研究了特征参数的提取和抗噪性能,并对当今主流分类器做了深入的研究。所有工作主要针对噪声环境下文本无关的开集说话人辨识展开。在预处理阶段,考虑到广泛应用于编码理论的信息熵代表信源的平均不定性能导致语音的熵和噪声的熵存在较大差异,本文采用了基于熵函数的语音端点检测方法,试验表明谱熵法在信噪比较低和非平稳噪声下具有良好的性能,进而提出了一种动态阈值的方法检测语音端点。考虑到噪声频带一般不覆盖整个语音范围,因此,本文采用多子带特征提取,并在每个频带内使用基于Teager能量的子倒谱特征。本文还设计了一种用AdaBoost算法优化的支持向量机与高斯混合模型相结合的系统。首先用优化的支持向量机对每个子带分别决策,筛选出训练集之外的说话者,然后对集内人用判别结果进行特征加权以突出对识别结果影响较大的子带特征,从而降低了噪声对对识别结果的影响,最后用优化的高斯混合模型进行识别。试验结果表明,本文系统在低信噪比环境下具有较好的识别性能。
其他文献
嵌入式系统的研究和开发是当前信息技术研究的热点之一。作为人机交互的图形用户界面(GUI)是嵌入式系统非常重要的组成部分。伴随着嵌入式系统的迅速发展,嵌入式GUI系统也得
自然现象的模拟是计算机图形学中十分重要的领域,其中火焰的模拟更是一个有意义且富于挑战性的课题。传统的基于粒子系统和纹理映射等方法的模拟技术难以胜任真实感要求较高的
现代科技的发展,尤其是生物实验技术和下一代基因测序设施的发展,每天都会产生大量的生物实验数据。为了有效的分析和利用这些数据,需要构建基因调控网络,去挖掘隐藏在数据背后的
直推式可信最邻近分类器(TCM-NN)是基于算法随机性理论提出的一种新的分类算法,它不仅能够判断样本的类别,还能够为每一个判断提供可信度,这对于分类机器的应用是很有意义的
“计算机接口技术”是一门实践性很强的课程,实验在这门课程中占有重要的位置。但目前现有的实验设备无法完全满足当今的教学需要,为此,本文提出了一种新型的计算机接口实验
许多生物序列数据库中都含有大量的冗余序列,这些冗余序列通常不利于对数据库的统计分析和处理,而且它们要占用更多的计算机存储和处理资源。去除这些冗余信息具有很高的实用价
测试用例的选择对于作为保证软件质量重要手段的软件测试的成败起着至关重要的作用,测试用例设计的目的是确定一组最有可能发现某个错误或某类错误的测试数据,实现系统对某个
物质配送在物流活动过程中充当着十分重要的角色,是与消费者直接相关联的重要环节。然而,配送成本在物流总成本中占着很高的比重。如何采用更科学、合理的配送方法逐渐成为学
事件驱动软件是当今软件的主流。其中GUI软件和WEB软件应用最为广泛。关于它们的软件测试一直是研究的热点。由于测试集庞大以及测试成本的限制,GUI软件和WEB软件的测试一直
大规模的网络部署、自组织的组网方式、能量有限的网络节点、动态变化的无线信道以及各种类型的流量模型和数据收集方式是传感器网络的固有特性。这些特性在实现网络功能的同