混响环境下的语音增强研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:carboy123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着音视频通讯和基于语音识别的人机交互系统在生活中有了越来越广泛的应用,实际环境中各种复杂的场景对语音增强技术提出了更高的要求。混响是常见的影响语音音质和可懂度的不利因素,也会影响盲源分离等算法以及语音识别系统的性能。如何提升语音增强系统在混响环境下的性能是实际应用中面临的难题。本文围绕混响环境下的语音增强问题,重点关注在线去混响算法、混响环境下的在线语音分离和基于深度神经网络的语音增强三个方面的问题。基于多通道线性预测(Multi-channel Linear Prediction,MCLP)的自适应算法是一种有效的去混响方式。而声源位置的突变是影响在线自适应去混响算法性能的不利因素。本文研究了基于RLS(Recursive Least Squares)算法和基于卡尔曼滤波的自适应MCLP去混响算法的追踪性能。基于滤波器系数相对变化量,本文针对基于RLS的自适应MCLP去混响算法设计了时变的时间遗忘因子,针对基于卡尔曼滤波的自适应MCLP去混响算法设计了一种重置机制,提升了RLS算法和卡尔曼滤波在声源位置发生突变的情形下的鲁棒性,并通过仿真和实验数据验证了改进算法的性能。盲源分离算法是一种从混合语音中获取目标信号的有效方式,然而混响通常会影响盲源分离算法的性能。本文研究了混响环境下基于微型双传声器系统的语音增强问题,设计了两个一阶心形差分波束用于获取混响中的语音信号,并在系统中增加基于MCLP的语音去混响算法,进一步提升盲源分离算法的性能。本文同时也提出了一种在线盲源分离和去混响的联合优化算法,并通过仿真验证了系统的有效性。基于深度神经网络的语音增强算法已经在特定的场景中表现出了优异的性能。时域语音分离网络是一种接收时域信号输入并输出时域信号的深度神经网络结构,能够实现较好的语音增强性能。本文关注基于深度神经网络的语音增强方法在高混响环境以及低信噪比下的性能,基于全卷积时域语音分离网络,提出了一种去混响和语音分离联合优化的网络结构以及针对在线语音增强的改进方案,并通过实验验证了它们的性能。
其他文献
机械式仪表具有结构简单、便于维修且价格低廉等优点,在石油勘探、油田设备运行监测中普遍使用,是获取机械设备信息,实现设备状态监测的重要手段。一般,仪表信息的获取是由指针示数或偏转值来表达的,经人工读表或抄表的方式获取示数。读数过程容易受到各种主客观因素的影响,如人眼分辨能力、观察角度、现场光线及各种环境因素等。人工读表既浪费时间和精力,且不能保证准确读数,容易产生误差,导致不能准确、及时地获取机械设
自进入网络时代,隐私关注与在线自我表露就成为各界研讨焦点,尤其两者之间矛盾,即“隐私悖论”是否必然存在广受国内外学者热议。据此,利用Citespace软件对以往研究热点进行回顾反思,并引出研究问题:广州大学生微信用户有无存在“隐私悖论”现象?信任度、网络素养、边界管理等变量如何作用于隐私关注与自我表露?针对研究问题,紧扣自我表露、信任度、网络素养三大面向,设计测量指标体系,创新性将自我表露细化为深
习近平新时代共享发展理念是以习近平同志为核心的党中央根据中国改革开放的实践及其他国家的发展经验,针对我国新时代发展问题提出的核心理念之一。它既是时代发展的迫切要
随着我国烟草行业的发展到了瓶颈期,通过单方面扩大生产规模、增加市场占有率,提升企业利润已经逐渐变得不太可行。而招评标采购,作为烟草工业企业物资采购供应链的源头,在源
三维测量技术在如今快速发展的社会逐渐崭露头角,满足了人们的日常需求同时也提高了人们的生活水平,在逆向设计、工业制造与检测、医疗康复、古董检验等等领域中,物体三维轮廓测量已经逐渐得到应用。由于精度高,具有非接触性,测量范围广等优点,主动式投影结构光的三维测量技术得到了一致好评,但是非线性误差、相位误差优化在数字投影设备的问题,以及相机和投影仪的标定问题、三维测量重建和断截相位的相位解包裹等,都是三维
随着社会的高速发展,仅仅物质水平的提高不足以满足人们的需求,精神文化的丰富就显得尤为重要。因为彩票业恰好是娱乐产业的不可或缺的一部分,体育彩票又可以极大地丰富人民
随着中国通讯业不断深化体制改革,尤其是运营商的重组,我国电信行业形成了由中国移动、中国电信、中国联通三方竞争格局。4G牌照的发放,标志着中国正式进入新时代,随着全网通手机的逐渐普及,三大运营商制式壁垒被打破,开启了新的终端渠道结构模式。在这个新的市场环境下,运营商如何更深入地完成渠道架构设计,培育、管理和抢夺优质渠道资源,如何扬长避短、精确定位、精细管理,构建符合市场发展趋势的渠道体系,成为三家运
当代社会信息化的快速发展致使信息的泄露范围越来越大,而个人信息的隐蔽性又导致侵权行为不易被侵权主体所察觉,但是一旦出现信息侵权行为,遭受损害的利益却是巨大的,所以我
目的:本研究观察洛铂联合紫杉醇两周期新辅助化疗序贯同步化放疗治疗IIBIIIB期子宫颈鳞癌的近期疗效、毒副反应、远期生存率及预后影响因素。方法:2014年1月-2016年12月贵州省肿瘤医院乳腺妇瘤科入组FIGO分期IIBIIIB期155例全部经病理证实为子宫颈鳞癌患者,洛铂联合紫杉醇新辅助化疗,化疗方案:紫杉醇175mg/m2,静脉滴入,d1,洛铂30mg/m2,静脉滴入,d2,21天为一周期,
在医药领域,药物的主/微量关键组分的快速准确测定,在药品的生产、质量监控以及药物的功能成分分析中占据重要的地位。针对特定的药物,建立专属性的快速药物分析检测方法就尤为必要。本工作利用抑制电导离子色谱仪,建立了快速准确测定4种药物中主/微量关键组分的分析测试方法。具体的研究内容如下:建立了抑制电导离子色谱法测定氯离子含量,以间接确定氯沙坦钾含量的方法。本方法采用氧瓶燃烧处理样品,以石英布作为样品包覆