稀疏表示和特征字典在语音增强中的应用研究

来源 :苏州大学 | 被引量 : 1次 | 上传用户:jerrykfczz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号处理作为一个重要的研究领域,与高速发展的信息时代有着密切联系。由于噪声和混响的干扰,在许多语音信号处理系统中,目标信号往往是含噪语音信号。被污染的语音对语音信号本身的结构以及可懂度均有较大损害,因此,在接收端须使用某种技术对其进行降噪处理。语音增强是现实环境中解决噪声污染问题的主要技术之一。当语音信号受到噪声污染时,通过一些特定的处理,语音增强可以有效提高语音质量和可懂度。非平稳噪声的有效抑制一直是受研究者关注的问题,基于字典学习和稀疏表示的语音增强方法给非平稳噪声的滤除提供了一种新的途径。与现有的字典学习类语音增强算法不一样的是,本文选取语音信号和噪声信号的幅度谱与功率谱特征作为字典学习的输入,将两者综合运用到语音增强算法系统框架中。语音和噪声信号的幅度谱和功率谱特征被用于训练字典,含噪语音在训练产生的特征字典上进行稀疏表示。最终重构出的增强语音将由两路信号加权恢复,其中一路信号由幅度谱获得,另一路信号由功率谱获得。基于两路信号的区别和联系,下面简要概括论文的几点思路。首先,现有的基于稀疏表示和字典学习的语音增强算法中往往只利用一路特征信号恢复出最后的增强语音。论文基于稀疏表示和特征字典学习,对单通道下的语音增强算法进行了研究,提出了一种双路特征的语音增强算法。一方面增加了系统框架的灵活性,另一方面,该算法充分挖掘了语音信号的幅度谱和功率谱与语音增强的联系,将幅度谱和功率谱字典综合运用到语音增强中,改善了一路特征信号的语音增强算法在不同噪声环境下适应度不同的问题。其次,提出基于稀疏表示和字典学习的噪声功率谱估计方法。稀疏表示和字典学习方法对信号的表示能力主要依赖于信号结构性的强弱,不要求信号具备平稳性约束条件,克服了传统噪声功率谱估计方法对于语音信号相邻帧的噪声功率谱值实时更新不准确的缺陷,提高了非平稳噪声环境下噪声估计的追踪估计能力。最后,对于噪声类型这种重要的先验信息,论文在语音增强预处理阶段,增加噪声分类模块,通过神经网络算法判断噪声类型。噪声种类分集内集外两种,确保了几种常见噪声类型判断的准确性。依据获得的噪声类型,论文在语音重构阶段设计了自适应的语音重构权值,两路信号加权恢复时的权值依据噪声类型的改变而自适应改变,因此提高了算法的噪声适应度。
其他文献
局部放电是造成高压电气设备最终发生绝缘击穿的重要原因。对局部放电进行在线监测,并及时排除可能发生的故障,对保障人民生活生产用电具有重要的意义。本文针对光纤传感技术
本研究采用具有低毒性、较大体表面积、良好生物相容性、粒径易于合成从30nm到1OOnm并且易于生物大分子结合特点的中空金纳米粒(Hollow gold nanospheres,HAuNs)作为主要材料;硫辛酸(Lipoic acid,TA)与具有质子海绵效应的聚乙烯亚胺(Polyethylenimine,PEI 2kDa)反应获得聚乙烯亚胺-硫辛酸(PEI-TA)再连接到HAuNs表面,从而构建了
近几年来,过渡金属硫族化合物(TMDs)由于其优异的机械、电学、光学和热学等物理性质而越来越引人关注。MoTe2是TMDs材料的一种,有着各向异性的晶体结构和高载流子迁移率,其吸收光谱范围能覆盖可见光和近红外区域,因此在电子学和光电子学领域有着巨大的应用潜力。到目前为止,大面积合成高质量的MoTe2晶体的技术尚未成熟,这使得了 MoTe2始终难以应用到实际中去。针对这些问题,本论文系统研究了 CV
随着工厂转型升级,工厂自动化、智能化水平不断提升,打造智能化工厂成为许多生产企业发展的新战略。在工厂物流的智能化升级中,物流机器人是其重要一环。物流系统中,通常都是
随着光伏的大规模接入电网和需求响应的深入开展,光伏功率预测和需求侧资源的整合越来越重要。需求侧资源(用户、光伏)是需求响应实施的主要对象,这些资源的调度潜力大,但大
家用空调室外机是空调噪声的主要噪声源,空调室外机的噪声与其振动有着直接的关系。在空调出厂前,空调生产商根据空调室外机的振动对其进行故障检测。在生产线上,主要是依靠
伴随社会的全面发展,居民不但物质生活水平得以提高,消费观念和居住认知也在潜移默化中发生了微妙的调整,居民更加注重健康生活,对体育运动的消费需求相应增加,体育地产的建
降水是地球水循环的重要过程,与水文、气象等过程密切相关,降水研究对于气候变化、水文循环、干旱监测等科学研究都具有重要意义。高精度、高时空分辨率的降水产品对水文过程
机器学习已在很多现实任务中取得了成功。成功背后往往依赖于充分的标注数据。然而,在现实任务中,标记数据的获取困难,数据产生的速度远大于数据标注的速度。不依赖充分标记
互联网社交媒体近年来的迅猛发展,海量文本数据每日在各种社交媒体上生成和传播,伴随着人们对成本要求的提高,自动化的从互联网上的文本信息提取关键信息并生成相应文本就越