基于语音存在不确定度的码书驱动语音增强方法研究

来源 :北京工业大学 | 被引量 : 2次 | 上传用户:yangbao_2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经过40多年的发展,研究者们提出了许多语音增强算法,如谱减算法、维纳滤波算法和基于统计模型的算法。这些算法在平稳噪声环境下能取得较好的增强效果,而在处理非平稳噪声时,其算法性能下降严重。码书驱动算法克服了上述算法的局限性,即使在非平稳噪声环境下仍然能获得较好的增强效果。码书驱动算法将语音和噪声的自回归(Auto-Regressive,AR)系数作为先验信息进行线下训练存储在码书中,并在线上通过对数谱失真准则估计各自对应的AR增益,所获得的AR参数用于构建维纳滤波器,从而增强带噪语音信号。但是码书驱动算法仍然存在三方面不足:一是码书驱动算法的AR参数估计不准确,导致在静音段仍然残留大量背景噪声;二是该算法只考虑提高语音的幅度谱估计性能,却忽略了语音的相位谱估计;三是传统先验码书只对语音和噪声的谱包络建模,而没有对其谱细节进行建模,这造成增强语音的谐波间仍然残留大量的背景噪声。针对上述三点不足,本文提出了如下改进方法:1.针对码书驱动算法的AR参数估计不准确问题,本文提出了一种基于语音存在不确定度的码书驱动语音增强算法。该算法在原始Bayesian参数估计框架中考虑了两种假设,即语音存在假设和语音不存在假设。与传统方法不同,语音和噪声的AR参数的Bayesian估计是在两个假设条件下得到的AR参数估计的加权和,其中的加权系数是线上基于帧变化的语音存在概率(speech presence probability,SPP)和语音不存在概率(speech absence probability,SAP)。增强语音谱仍然由重构的维纳滤波器得到。由于所提算法在Bayesian框架中结合了SPP和SAP,因此能够提高AR参数的估计精度。2.针对传统码书驱动算法忽略语音相位谱估计的问题,本文提出了一种纯净语音相位谱估计算法。该算法利用纯净语音、噪声和含噪语音之间的向量关系得到含噪语音与纯净语音相位差的余弦表达式,进而利用反余弦函数和含噪语音的相位得到纯净语音的相位估计。所估计的语音相位谱取代传统含噪语音相位谱与增强语音幅度谱相结合来得到纯净语音信号,进一步提高了低信噪比下的增强语音的感知质量。3.在前述的基于语音存在不确定度的码书驱动算法中,SPP和SAP存在估计精度不高以及无法抑制增强语音谐波间噪声的问题,为此,本文提出了一种基于贝叶斯AR参数估计的码书驱动语音增强算法。为了提高SPP和SAP的估计精度,该算法结合当前帧和过去帧的含噪语音信号来估计语音和噪声的AR参数。同时,利用隐马尔可夫模型(Hidden Markov Model,HMM)理论来推导SPP和SAP,并利用归一化互相关系数对HMM中语音存在状态和语音不存在状态之间的转移概率进行调整,此外,该算法将基于频点的语音存在概率与维纳滤波器相结合,有效抑制了增强语音谐波间的噪声。实验证明,所提算法要优于参考算法。
其他文献
基于中继协作技术的无线MIMO中继协作系统,因其具有高传输效率和系统性能,近年来成为广泛关注的热点问题。该技术利用中继节点辅助发射端传输信号,构成虚拟MIMO系统,进一步获
海藻多糖具有多种生理活性,如抗肿瘤、抗氧化、机体免疫调节等,且毒副作用小,已成为海洋天然产物研究的热点之一。研究发现复合多糖药理作用呈现协同性,目前食用菌和中草药复合多
近年来新兴的无线摄像头、移动可视电话、无线视频传感器网络等应用,对视频编解码和传输技术提出了新的要求。分布式视频编码技术因其独有的优势,可应用于某些特殊的场景。但目
油蒿(Artemisia ordosica Krasch.)是内蒙古鄂尔多斯高原特有的半灌木,构成该地区沙地优势植被类型。主要分布在固定、半固定沙丘,同时在流动沙丘也有少量分布。它在当地经济价
学位
智慧能源作为节能环保和新一代信息技术融合的新型产业,具有庞大的市场空间,正在我国乃至全球引发技术和产业革命。IEEE1888作为智慧能源领域的重要国际标准,将能源控制总线转化
波达方向(Direction of Arrival,BOA)估计算法研究在国家与国民生活领域都有着十分广泛的应用场景,这些场景涵盖信息战、移动卫星通讯、地震监测、海洋声呐研究、射电天文学、
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
本论文以西双版纳地区橡胶林为研究对象,在西双版纳的低(550 ~ 600 m)、中(750 ~ 800 m)、高(950 ~ 1050 m)3个海拔梯度各选取5块橡胶林样地,观测了橡胶林土壤含水量、物候、
黄瓜(Cucumis statirus L)是设施蔬菜生产中主要的栽培种类,但由于有限的耕地面积与市场周年需求的矛盾,导致黄瓜连作现象普遍,连作障碍严重,化感作用是其中重要的原因之一。目
生存素(Survivin)主要通过直接抑制Caspase家族分子及其他凋亡通路,并对细胞有丝分裂周期蛋白激酶等进行调节来抑制细胞的凋亡。目前Survivin在小鼠胚胎着床及蜕膜化过程中的表