自回归模型驱动的语音增强算法研究

来源 :北京工业大学 | 被引量 : 3次 | 上传用户:dancheman001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强旨在抑制含噪语音中的噪声并保证增强语音的质量。传统语音增强算法如谱减法、维纳滤波法等,不适合处理非平稳噪声,是因为没有考虑信号的先验信息。为解决这一问题,一类基于信号先验信息的语音增强算法应运而生,其中最具代表性的当属基于隐马尔科夫模型(Hidden Markov Model,HMM)的语音增强算法和基于码书的语音增强算法。这类算法线下利用HMM或码书存储语音和噪声的自回归(Auto-regressive,AR)谱形状先验信息,线上结合某些参数估计器估计语音和噪声的AR模型参数,包括AR谱形状和谱增益,并利用获得的AR模型参数构建维纳滤波器增强含噪语音。因为估计的AR谱增益能够快速追踪线上噪声能量,所以可以较好地处理非平稳噪声,但该类算法仍然存在一些问题。例如,传统并行HMM(Parallel HMM,PHMM)语音增强算法忽略了训练集与测试集能量不匹配问题,传统码书驱动语音增强算法AR模型参数估计精度不高、无法抑制谐波噪声和噪声需要分类等问题。为此本文提出了相应解决方法。本文的研究工作主要包含以下三部分内容:第一,基于传统的PHMM语音增强算法原理,本文提出了一种增益自适应的PHMM语音增强算法。该算法将自回归(Auto-Regressive,AR)谱系数和梅尔频率谱(Mel-Frequency Spectral,MFS)系数作为并行特征,用于训练PHMM,所得PHMM由AR-HMM和MFS-HMM构成,其中AR-HMM用于估计维纳滤波器,而MFS-HMM用于获得维纳滤波器的加权值。同时,所提算法引入了两个能量增益因子用于自适应调整线上语音和噪声能量,解决了训练集与测试集之间能量不匹配问题,提高了算法的鲁棒性。第二,基于传统的码书驱动语音增强算法原理,本文提出了一种利用马尔科夫过程和语音存在概率的码书驱动语音增强算法。该算法利用马尔科夫过程对相邻帧间码字的相关性建模并用于优化贝叶斯参数估计器,提高了AR模型参数估计精度。同时,该算法将语音存在概率与码书驱动维纳滤波器相结合,解决了传统码书方法无法抑制含噪语音谐波间噪声的问题,保证了增强语音的感知质量。最后,针对传统码书驱动语音增强算法中AR谱增益估计精度不高以及噪声分类问题,本文提出了一种基于AR谱增益乘法迭代估计的码书驱动语音增强算法。该算法利用线上噪声估计模块获得的噪声AR谱形状取代线下训练噪声谱形状码书,并采用乘法迭代估计方法估计AR谱增益,这不仅解决了噪声分类问题,而且提高了谱增益的估计精度,所获得的增强语音能量保留更高,残余噪声更少。
其他文献
地理信息系统是一门集计算机科学、信息科学、现代地理学、测绘遥感学、环境科学、城市科学、空间科学和管理科学为一体的新兴学科。它同时也是一个技术系统,是以地理空间数
septin是人们在筛选芽殖酵母控制细胞周期的温度敏感型突变体时发现的一类与细胞周期调控相关的基因。随着生物学的飞速发展,人们在除植物以外的几乎所有真核生物中发现了这一
帕金森病(Parkinson’s disease,PD)是多发于中老年人的神经系统退行性疾病,主要病理改变是中脑黑质(substantia nigra,SN)致密带多巴胺(dopamine,DA)能神经元退行性变,进而导致纹状体(st
随着Internet技术的高速发展,用户对网络宽带的需求不断提高。现有的G/10G比特的EPON,10G EPON接入网络能够为用户提供高效的数据传输速率,然而也面临着更加严峻的安全威胁,
期刊
医学影像作为一种辅助的医疗手段,可以帮助人类检测、判定、认识和研究疾病。现有的医学成像方式不足以帮助人类对疾病的探索与研究。光声成像作为一种新型无损生物医学成像技
随着信息技术的迅猛发展以及社会信息化需求的快速增长,人们对视频、数据、话音等全业务接入带宽需求越来越高。下一代广播电视网(NGB)建设将实现广电运营商从基础广播网络运
目标跟踪是计算机视觉领域的一个核心问题,在视频监控、机器人视觉导航、人机交互、以及医疗诊断等许多方面有着广泛的应用前景。在机载光电跟踪系统中,目标跟踪是一个关键技
在不考虑任何先验知识的情况下,传统的单通道语音增强算法(如维纳滤波法、谱减法、统计模型法)虽然在平稳噪声环境下能获得较好的增强性能,但是在应对现实生活中常见的非平稳
自然界木本植物在某些情况下可能面对淹水带来的胁迫伤害,木本植物对淹水的生理生态响应及适应机制的研究,不仅可以从机理上解释河岸带和消落区树种分布的规律,对于大型水库消落
学位