基于复值神经网络的信号增强处理方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:woshishouhushen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强是指从含噪语音中恢复出干净语音的过程,通常是在时频域中对信号进行处理。通过短时傅立叶变换(STFT)可以将语音的时域信号变换到时频域信号,从而获得(复值)语谱图。基于语谱图的增强是实现语音增强的主要研究方向。然而人们通常只关注语谱图中幅度谱信息而忽视它的相位谱信息,这主要是因为:1)幅度信息有很强的结构性,便于识别和压缩语谱图中噪声谱的能量;2)相位缠绕(phase wrapping)问题会导致语谱图中相位信息分布散乱,使之难以估计和重构。业已证明相位信息能有效提高语音质量,因而相位信息的估计和重构是语音增强中的一个重要问题。本论文主要研究语音增强中语谱图中幅度信息和相位信息的重构方法、实现复值语谱图的信号增强。论文主要工作包括:1)讨论利用神经网络模型进行语音增强的方法,分析了应用实部虚部复值神经网络在语音增强问题下的表现,并将其与对应的实值神经网络进行对比,仿真结果表明:在给定合适激活函数的情况下,复值神经网络略优于实值神经网络;2)从幅度和相位角度分析了相位重构所带来的好处,给出了利用神经网络来进行相位估计以及后续的相位重构的算法,并结合该算法构建多目标的实数神经网络和复数神经网络以同时估计幅度和相位信息。仿真结果表明:相较于只采用幅度增强的方法,联合幅度和相位信息的增强方法能明显提升性能。对女性说话人而言,在OdB的噪声环境下至少可以提升信号衰落比(SDR)0.4以及extendedSTOI(ESTOI)0.02的分数;对男性说话人而言,则大约可以提升SDR 0.3、ESTOI0.01 的分数。
其他文献
6061-T6铝合金凭借高比强度、低密度的特性在地铁、高速动车组等车体制造上受到广泛应用。在铝合金连接中搅拌摩擦连接作为一种绿色固相连接技术发挥着重要的作用,随着交通工具运行速度加快,对连接区各项性能提出更高要求,其中耐冲击性是车体在高速冲击下保持完整的首要因素,是对司乘人员安全的最大保证。本文通过将搅拌摩擦连接的直线轨迹改为摆动的S型轨迹,有效地提升了连接区的冲击韧性和耐盐雾腐蚀性能,并对S型轨
国家级经济技术开发区的建立是我国一项重要的经济开放政策,建立30年来,在不到全国千分之一的土地上,创造了全国十分之一的国内生产总值,吸引了全国近一半的外商直接投资,成
视觉对于人类来说是获取信息的重要渠道,对于服务机器人来说亦是如此。通过视觉感知环境信息是服务机器人与使用者友好交互的关键技术,而其中的物体检测、目标跟踪是实现服务
改革开放以来,出口需求和投资需求为我国经济高速发展贡献了极大的力量,但是,现阶段,我国主要出口国受国际金融危机、欧洲债务危机的影响经济低迷,出口和投资这两支拉动经济
随着越来越多的云计算公司和不同功能云服务的推出,云服务的应用已经进入全民化时代,给用户带来极大便利。但是由于各云平台间缺乏统一标准,不同的接口规范及数据格式等让开
移动互联网的迅速发展,在给人们获取信息带来便利的同时,涌现出大量的垃圾信息影响人们的正常工作和生活。垃圾信息通常以声音、文本、视频、图像等媒体形式进行传播,而广告
国网吉林供电公司不断创新,在服务手段上做"加法",使末端管理更精细,客户响应速度更快,服务技能水平更高,极大提高了客户满意度。2019年,国网吉林省吉林供电公司持续深化"全
期刊
本文重点是研究基于果蝇优化算法鲁棒性数字水印,通过果蝇优化算法(Fruit Fly Optimization Algorithm,FOA)择优选取水印缩放因子的大小,提高水印的鲁棒性。首先,结合小波理
中国,作为世界四大文明古国之一,经过数千年的朝代更替,时间迁移,很多原本流传于世的文学作品遗失在历史的长河中,那些遗留下来的作品在存储空间和保存质量上都面临着许多有
自2015年“宝万之争”事件升级发酵以来,越来越多的公司出于抵御敌意收购的目的,不断加快公司章程中反收购条款修订的步伐。通过设置反收购条款,管理层可有效维持控制权,同时