基于盲源分离的车载语音增强算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:xiaokun787
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音作为一种方便、快捷、有效的交流方式,在人们的日常生活中扮演着非常重要的角色。随着社会科技的不断进步及其人工智能的迅猛发展,语音信号也逐渐成为人-机交互的一种重要方式,其较传统的人-机交互方式更加的便捷、高效和安全,故被广泛应用于工业控制、医疗辅助、安防保障、智能家居等诸多方面。然而在实际的应用场景中语音信号不可避免的会受到周围环境噪声的干扰,进而影响语音质量,导致其无法完成正常的人-机交互功能。因此语音增强作为一个能够有效抑制噪声分量,提高语音质量的方法,具有重要的研究意义和应用价值。针对车载环境这一特定的应用场景,噪声信号具有低频分布、先验知识不易获得、与语音信号混合情况复杂等特点,造成了许多语音增强算法并不能很好的适用于车载环境。因此本文在分析车载噪声和车载声学场景的基础上,建立噪声信号和语音信号的卷积混合模型,研究盲源分离(Blind Source Separation,BSS)技术在车载环境下进行语音增强的有效性和可行性,以提高车载环境下带噪语音信号的质量和可懂度。本文具体开展了以下的工作:(1)车载声学场景分析建模和噪声估计算法研究。根据车载环境所固有的特点,分析车载噪声的来源及其和驾驶员语音信号在车内的传播路径,建立噪声信号和语音信号在车内的卷积混合模型。由于多数语音增强算法都需要噪声的估计值作为消噪的先验知识,因此噪声估计的准确性将直接影响这些语音增强算法的性能。本文在归纳总结一些常用的语音处理理论基础上,对现有常用的噪声估计算法进行了研究,包括语音端点检测噪声估计算法和最小值控制递归平均噪声估计算法。(2)语音质量评价和语音增强算法研究。文章归纳总结了一些常用的语音信号质量主客观评价标准,并分析了这些评价标准的优缺点。同时针对真实环境下客观评价标准缺少参考源这一问题,本文构建了一个基于隐马尔科夫模型(Hidden Markov Model,HMM)的小词汇量语音识别引擎,并将语音识别率纳入了无参考源语音质量的评价体系中。对于语音增强算法的研究,文章首先实验性分析了谱减法和维纳滤波法这两个经典的语音增强算法,并给出了它们对车载带噪语音信号的消噪结果;其次针对一些传统语音增强算法的不足,本文提出了一个改进的小波阈值函数语音增强算法,该算法可有效抑制宽带噪声和提高语音质量;最后文章阐述了独立分量分析(Independent Component Analysis,ICA)的基本理论框架和实现原理,并重点研究了利用基于负熵的复值ICA在频域盲解卷积,实现语音增强的过程。该ICA语音增强过程不仅可以较好的契合卷积混合模型,而且可以很好的弥补现有语音增强算法在车载环境中应用的不足。(3)基于卷积ICA的车载语音增强算法研究。文章根据语音信号和车载噪声信号的卷积混合特性以及它们在频域的非高斯分布特性,提出利用基于负熵极大的卷积ICA对车载带噪语音信号进行语音增强,并对该增强过程进行针对性的优化。文章在仿真环境,室内环境,真实车载环境三种声学场景下构建了车载带噪语音信号语料库,并采用基于负熵的卷积ICA进行语音消噪。实验结果表明,该卷积ICA消噪后语音信号的识别率较车载带噪语音信号分别最高提高了18.33%,30%,27.5%,展现出该卷积ICA在车载声学场景中应用的有效性和鲁棒性。最后本文针对频域盲解卷积ICA的语音消噪效果受语音信号分帧长度和帧移大小影响的问题进行了实验性研究和阐述。(4)复杂环境下语音增强系统的研究和实现。本文在所研究的噪声估计算法和语音增强算法基础上,选择部分算法结合语音媒体控制逻辑,在Windows平台下利用C++实现了一套复杂环境下的语音增强系统。该系统具有语音波形显示,频谱显示,选择性语音增强、语音播放保存等功能。测试结果表明,该系统不但具有较好的语音增强性能,同时获得了较强的可靠性和鲁棒性。
其他文献
随着互联网的迅速发展,网络规模急剧增大,结构日趋复杂,大规模网络已经成为网络研究的热点。网络模拟能够研究复杂网络行为,评价尚未实施的网络协议,具有成本低,易使用、模拟真实性
随着互联网的迅速发展,各行业信息化程度不断提高,越来越多的信息积累在网络上,如何在浩瀚的信息中寻找到有用的信息,一直是领域研究的热点。本文的研究背景是陕西省教育厅专项科
随着论坛等互联网社区的蓬勃发展,越来越多用户参与到互联网的建设中来,向互联网贡献数据。这些数据中很大一部分是对人物和事件的评论,包含了用户的观点和态度。浏览这些信息能
近年来,基因调控网络一直是一个生物信息学中的热点问题。基因调控网络描述的是基因之间的相互调控关系,通过分析该网络,可以从中发现基因之间相互作用和协同工作的原理,并且
所谓共指消解就是将对应同一实体的多个表述划分到一个等价类的过程。共指消解是信息抽取中的一个重要子任务,在自然语言处理和信息检索的各个领域有着重要的应用。传统方法将
心脏的收缩和舒张为人体的血液循环提供动力,是人体的动力之源,然而心血管疾病一直威胁着人类的健康。由于临床医学对人体心脏的研究成本高、效率低,虚拟心脏的研究得以迅速发展
无线传感器网络(WSNs)由大量传感器节点组成,这些节点分布在一定的区域内,并且通过无线节点间的相互通信来组成自组织的网络。无线传感器网络的主要功能是环境监测和信息采集,并
现在人们已经进入了信息化时代,并且随着科技的发展,信息在人们平时的生产和生活中变得越来越重要。这些信息以不同的方式出现在我们的生活中,如何将这些信息加以良好的有效的利
实验教学评价的研究是提高实验教学质量,进行科学实验教学管理的重要保证。针对当前实验教学评价系统存在的问题,设计开发了高校实验教学评价系统。本文主要工作内容如下: 
随着网络和数字媒体的快速发展,存在于网络上的视频数据呈现爆炸式增长,如何进行有效的管理和版权保护已引起了人们的广泛关注。基于内容的视频拷贝检测(Content-Based Copy De