噪声与混响环境下的语音欠定盲源分离方法研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:xin__yonghu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音交互技术的发展,在实际场景中应用欠定盲源分离技术变得必不可少。欠定盲源分离广泛应用于语音分离、干扰减缓、图像处理和通信信号处理等领域,该问题的难点在于麦克风的数量小于源信号的个数。本文重点关注理想、噪声、混响环境下的欠定盲语音源分离问题。噪声与混响会影响语音质量与可懂度,也会影响欠定盲源分离的性能。如何在干扰存在的情况下,提升欠定盲源分离性能,这在实际应用中是一个非常困难的问题。本文基于稀疏分量分析思想,在两步法框架下应用字典学习技术来实现欠定盲源分离。此外,分别应用了语音降噪以及语音去混响技术来解决噪声与混响环境下的欠定盲源分离问题。具体工作内容如下:(1)为了降低不合适的训练字典尺寸对分离性能的影响,提出了一种自适应优化字典尺寸的迭代策略,用于两步法中源信号的重构。该策略通过比较候选矩阵中的原子对信号重构的贡献度,在每次迭代中对字典进行删除和添加原子,从而动态调整训练字典的尺寸大小,有效提高语音源信号的重构精度,达到提高语音欠定盲源分离性能的目的。所提算法在数据集Signal Separation Evaluation Campaign(SiSEC)上进行了测试,具有比统字典学习算法高约1~3d B的语音分离性能,因此从数据层面证明了所提方法的优势。(2)为了降低噪声对混合语音盲分离性能的影响,提出一种基于改进字典学习稀疏编码阶段的语音降噪盲分离方法。首先,利用改进SimCO稀疏编码的字典学习算法消除带噪混合语音中的环境噪声;然后,降噪后的混合语音在改进SASimCO稀疏编码的字典学习算法辅助下,执行欠定盲分离过程。最后,将Signal Separation Evaluation Campaign(SiSEC)数据集加入不同信噪比的高斯白噪声对所提方法进行了验证,降噪后的语音源分离性能提升约10%。(3)为了降低混响对混合语音盲分离性能的影响,提出一种基于混响时间估计的谱减法去混响方案。该方法首先利用卷积神经网络来估计混响时间,然后将估计的混响时间用于谱减法去混响。利用测试集对所提去混响方案进行验证,最后的去混响性能提升约16.5%。将该方案作为欠定盲源分离的前端处理方法,能够在混响存在的情况下,降低混响效应,最大程度提高欠定盲源分离的性能。
其他文献
以晚清大臣邓廷桢为代表的近代金陵邓氏家族,英才荟萃,文政有声,一门之中,四世填词,各有专集,可谓词林盛事。从清嘉庆朝至民国,邓氏词人的填词历程长达百余年,始终活跃于近代词坛,呼应着词坛的每一次大型运会转移,与近代词史的演变轨迹相关联、相阐明。同时,在多种词风并存共进的近代词坛,邓氏词人以进步性的理论构建和多样化的词体创作,为推进近代词学的层累与嬗变做出了不可磨灭的贡献。从邓廷桢作于鸦片战争时期堪为
学位
学位
福尔摩斯探案小说自晚清开始译入中国,一开始便受到热烈欢迎,“福尔摩斯”形象也成为最受中国读者欢迎的域外侦探家。横跨晚清民国,历经几个世纪,福尔摩斯探案故事在中国的阅读与接受经久不衰,甚至在民国时期涌现大量超脱文本的影视化形象和本土化的衍生仿作。本论文并不局限于仅仅讨论文本小说形象的福尔摩斯,而是结合晚清和民国的时代特征和读者想象,剖析中国读者对“福尔摩斯”在小说文本层面、影视图像层面、相关阅读材料
学位
学位
学位
鄂尔多斯盆地西缘地区位于山前复杂构造带,该区有多种源储组合类型,油气藏类型最丰富,勘探潜力大,具有重要的研究价值。在山前复杂构造带,隐伏构造对油气成藏具有重要的控制作用,是近几年各大盆地研究的热点,目前在西缘马家滩地区对二叠系隐伏构造特征、油气成藏以及有利区带评价研究较少。本次研究在收集大量的地质、地震、测井等相关资料的基础上,以最新的地球物理学、沉积学、构造地质学、石油地质学等前沿学科理论为指导
学位
近年中国北方鄂尔多斯盆地奥陶系海相页岩气勘探取得重大突破,含气量评价是页岩气区域储量评价、单井产量预测的重要依据。目前中国北方页岩气测井评价方法尚未建立,为明确鄂尔多斯盆地西缘页岩气发育状况,进一步扩大勘探有利区,基于常规测井系列开展页岩气含气量计算方法研究具有一定的实用意义。本文主要运用研究区常规测井资料和岩心测试分析等资料,在储层孔隙度、总有机碳含量、黏土矿物含量、矿物组分、含水饱和度的模型建
学位
随着大量油田由勘探阶段进入开发阶段,对油藏的描述精度要求越来越高,研究目标由对厚砂组的研究向单砂体、薄储层转变。但受塔里木地表条件复杂、目的层埋藏深、地震资料信噪比低等因素的影响,薄储层识别难度大。面对这种局面,迫切需要形成一套适用于塔里木盆地台盆区深埋薄储层预测技术,为科研和生产积累经验。同时,针对研究区块玉东1气藏,希望通过运用深埋薄储层预测技术,实现气藏规模重新落实。塔里木盆地塔北西部玉东1
学位
《中石油2019年环境保护公报》是中国石油天然气集团公司对2019年度环境保护工作的总结与公示,彰显了央企的责任与担当。众所周知,环境问题日益严重,国际社会对环境保护的探索与合作不断加深,因此,环境保护公报的准确翻译具有重要的现实意义。本报告以纽马克文本类型理论为指导对《中石油2019年环境保护公报》进行了翻译实践。纽马克在语言功能分类的基础上将文本类型划分为三大类,即:表情功能;信息功能;呼唤功
学位
随着多媒体通信技术的快速发展,人们对超高分辨率视频质量的需求越来越高。然而超高分辨率视频在编码传输过程中加剧了对网络带宽的需求,对存储设备和带宽资源带来了巨大压力,码率控制技术是解决上述问题的有效途径。多功能视频编码标准(Versatile Video Coding,VVC)是最新一代的视频编码技术,它引入更多的新特性以提升编码性能,但其码率控制尚未充分考虑这些新特性,其性能仍有提升空间。基于以上
学位