低信噪比场景下语音增强算法的研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户：b903630080

【摘要】

：

语音作为人们交流和表达情感的一种重要媒介,在日常生活中却总是受到噪声的干扰,因此我们需要对混入背景噪声的干净语音进行语音增强。语音增强算法的最终目标就是对背景噪声

【作者】

：

王红

【机构】

：

安徽大学

【出处】

：

安徽大学

【发表日期】

：

2017年期

【关键词】

：

语音增强低信噪比 LSA-MMSE 信号子空间语音听觉质量

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音作为人们交流和表达情感的一种重要媒介,在日常生活中却总是受到噪声的干扰,因此我们需要对混入背景噪声的干净语音进行语音增强。语音增强算法的最终目标就是对背景噪声进行抑制,改善语音听觉质量,同时保证一定的语音可懂度。人们对语音增强算法的研究已有半个多世纪的历史,这期间涌现过很多经典的语音增强算法,如谱减法、维纳滤波法、幅度谱最小均方误差算法等,且一直为人们所研究。这些算法在高信噪比平稳噪声下,通常可以取得良好的语音增强效果,但是在低信噪比非平稳噪声下,语音增强效果却不尽人意,还有很多需要攻克的难题。所以,在低信噪比非平稳噪声场景下对带噪语音信号进行语音增强仍是当前国内外学者研究的一个热点。本文主要针对对数谱最小均方误差(Log-Spectral Amplitude Minimum Mean-Square Error,LSA-MMSE)算法以及信号子空间算法在低信噪比场景下存在的缺陷提出改进。主要研究工作如下:首先,提出了低信噪比场景下改进的LSA-MMSE算法。针对传统LSA-MMSE算法在强噪声环境下语音信息完整保留效果不佳,本文将Loizou等人提出的大部分语音增强算法对带噪语音进行增强处理后普遍存在两种不同类型失真,这一理论应用到LSA-MMSE算法中。基于这一理论对LSA-MMSE算法提出了改进。以往学者总是将区域Ⅰ的衰减失真和区域Ⅱ小于或等于6.02dB的放大失真所对应的幅度谱归为一类处理,认为这样不会对语音信息的完整保留造成影响,研究表明这样反而会产生更多残留噪声。基于这一点,本文对衰减失真对应的幅度谱、小于等于6.02dB放大失真对应的幅度谱、大于6.02dB放大失真所对应的幅度谱分别采取不同程度的向下约束。另外,低信噪比场景下先验信噪比和增益函数的估计误差对语音增强效果有很大影响,改进的LSA-MMSE算法中分别对它们进行了调整。实验结果表明,低信噪比场景下本文算法更好地保留了语音的主要信息,同时有效抑制了低频部分的背景噪声。其次,提出了低信噪比场景下改进的信号子空间语音增强算法。子空间算法有着良好的去噪效果,但在低信噪比环境下仍然残留较多噪声。本文首先把滤除小于零的特征值及与之对应的特征向量,这一方法应用到传统子空间算法中,以达到优化信号子空间的效果。同时提出使用共享正弦多窗谱的协方差估计方法减小估计误差和计算复杂度。最后对估计的干净语音引入维纳滤波函数进行修正。实验结果表明,在5种常见噪声的低信噪比场景下,改进算法能有效去除背景噪声,改善语音听觉质量,其语音增强效果整体优于改进前的算法。

其他文献

自适应Mashup组件研究

互联网开放平台大量涌现，OpenAPI的数量与日俱增，由其搭建而成的Mashup以低成本高价值的优势迅速风靡互联网。然而，如何使得没有开发经验的用户也可以参与个性化应用的搭建，并实

学位

OpenAPIMashup推荐自适应

统一架构的ECC与RSA密码处理器的设计

近年来，随着互联网技术的飞速发展，信息安全已成为亟待解决的问题。使用公钥密码体制是提高信息安全性的重要方法。硬件实现的密码系统由于其诸多优势成为新的研究热点。本文在

学位

公钥密码RSA椭圆曲线密码素数域二元域蒙哥马利模乘CIOS

基于主动学习的语义缺失问句补全

交互式问答系统需要对上下文的语境进行处理，才能使系统有更强的理解交互能力。问句的语义缺失现象是必要处理的核心问题之一。在交互式问答系统中，存在着大量的语义缺失的问句

学位

问句分类省略恢复主动学习交互式问答

海洋实时监测数据流处理优化策略研究

随着数字海洋一期中对辅助决策系统的进一步研究，现已基本将整体框架建立完备，包括数据源：海洋台站和卫星采集的实时监测数据；传输网络：远海洋数据传输专线和近、中距离3G无线传输

学位

GPU私有云存储并行计算“数字海洋”辅助决策系统优化策略

基于单航班噪声等值线动态绘制的研究与应用

随着社会的发展，人们对空中交通的需求量日益加大，与此同时，一些不合理的机场扩建和航班计划所引发的机场噪声问题却引发了非常大的社会矛盾，如何科学地展示机场噪声成为当前一个

学位

机场噪声空间插值分段拟合等值线动态生成矩形网格法等值线平滑

云存储系统中属性基加密的访问控制方案研究

云计算作为一种新兴的分布式计算模式,具有按需自助服务、资源共享、多种网络访问等特点,被广泛地应用于企业及机构。中小型企业通过借助云计算平台外包计算及存储企业数据,

学位

云存储访问结构属性基加密策略隐藏可验证外包

基于点间互信息的主题优化方法

当今世界，随着信息技术的不断进步，各类信息资源都以较快的速度增长并呈现出海量的特征，其中数据主要还是以文本的形式出现。信息量已经满足人们的需求，但是如何高效地管理并且使

学位

主题模型Latent Dirichlet Allocation基于点间互信息的LDA主题优劣主题加权

面向多处理器SoPC的片上网络的设计与实现

单处理器的嵌入式系统已经不能满足用户的需求，多处理器系统已经成为未来嵌入式系统的主要发展趋势。现场可编程门阵列（FPGA）的出现给多处理器系统的设计带来了很多方便。相对于

学位

片上可编程多处理器系统现场可编程门阵列片上网络空分复用性能评估

基于图覆盖和环提升的低错误平层LDPC码研究

低密度校验码(Low-Density Parity-Check codes)是目前最接近香农限的一类纠错码。由于其良好的距离特性、低译码复杂度，已成为当今信道编码领域研究的热点之一。随着研究的不

学位

低密度校验码错误平层陷阱集图覆盖环提升

网关中状态数据包分类的研究

本文主要研究了数据包分类算法，以及数据包分类在入侵检测工具Snort和基于状态包分类的数据流检测中的应用。网络技术的飞速发展，给人们的社会生活带来很大便利。然而，网络用户

学位

数据包分类状态包分类数据流检测Snort

低信噪比场景下语音增强算法的研究

与本文相关的学术论文