偏度最大化多通道逆滤波语音去混响研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:hongqinshuling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
房间混响会降低语音质量和语音可懂度。随着免提电话、声控系统、音频会议系统等语音通信系统的普及,对语音质量及可懂度的要求越来越高。再者,混响会对语音通信系统中语音识别、声源定位等应用的精度造成严重的影响。对房间脉冲响应(Room Impulse Response,RIR)进行盲逆滤波是一种常见的比较有效的语音去混响方法。混响语音可以假设为对独立同分布的纯净语音进行延迟相加而得到,根据中心极限定理,混响语音的概率密度函数可以近似为高斯分布。高阶统计量是衡量非高斯性的重要参量,考虑纯净语音的非高斯特性,基于语音非高斯特性可实现语音去混响。  基于非高斯性极大准则,本文研究基于偏度的多通道房间脉冲响应逆滤波语音去混响方法,主要研究内容和创新点如下:  (1)提出一种基于高阶统计量的多通道语音去混响方法,该方法首次用多通道语音信号线性预测残差的三阶统计量偏度(Skewness)构造代价函数,以去混响重建信号线性预测残差的偏度最大化为目标自适应地更新逆滤波器(Maximum Linear Prediction Residual Skewness-based Inverse Filtering for Multichannel Speech Dereverberation,MLPRS-IF-MSD)。仿真实验结果表明,该算法相比于已有的基于高阶统计量的算法具有更理想的去混响性能,尤其在混响较强的情况下;该算法对加性高斯白噪声的鲁棒性更强;该算法的计算复杂度更低。  (2)提出一种基于偏度的房间脉冲响应逆滤波器与预测误差滤波器联合估计的多通道去混响算法(Maximum-Skewness Joint Estimation based-Inverse Filtering for Multichannel Speech Dereverberation,MSJE-IF-MSD),解决混响所引起的MLPRS-IF-MSD方法中线性预测系数估计不准确的问题,有效提高了逆滤波的精度。仿真和实测数据实验结果表明,MSJE-IF-MSD相较于MLPRS-IF-MSD算法的去混响性能有一定提升,且对噪声更具鲁棒性。  (3)研究通过估计晚期混响成分的短时功率谱密度,利用谱减法实现对逆滤波后的重构语音信号进行残余晚期混响抑制。仿真实验结果表明,该算法能够有效地抑制残余晚期混响,从而进一步提高语音质量。
其他文献
在利率市场化进程中,银行盈利结构、盈利方式发生了较大的变化.传统以利息获得利润的方式也逐步扩展至利息与非利息结合的盈利模式.基于此,为进一步提高银行经济效益,本文以
猴免疫缺陷病毒(Simian Immunodeficiency Virus, SIV)在基因组成、形态、理化特性、分子生物学特性和致病机制等方面与HIV非常相似,因此以SIV或SHIV(SIV与HIV-1构成的一种嵌
该文介绍了SDH和SDXC的基本原理与主要技术,全面分析并讨论了同步数字交叉连接系统的总体设计方案,对SDXC系统之中的核心部分--交叉连接盘成功的进行了设计和电路实现,并且通
应用混沌信号处理技术的前提是确认混沌的存在.混沌检验标准中,Lyapunov指数是一个重要参量,理论上正的最大Lyapunov指数是检验混沌的必要条件.因此,实际计算中Lyapunov指数
事业单位与传统单位在管理模式与管理思想上都与传统企业有所不同,在固定资产的内部控制与管理要点上应当独立分析,思考当前事业单位固定资产内部控制的问题所在,同时分析管
该论文先从理论上论述多媒体呼叫中心的支撑技术CTI技术,包括其发展史和技术内容,然后介绍了呼叫中心技术本身以及推动其发展的其他技术,比如因特网技术、IP电话技术、统一消
该文首先阐明通信背景和相关理论并分析了传输信道的特性,在此基础上对数据传输系统的信道抗干扰传输技术进行了研究.按照系统的要求和技术指标,对信道差错控制系统进行了方
图像实时压缩处理是数字图像通信的关键技术,无论在民用上还是军事上均具有广泛应用.该课题解决红外导引头成像传输问题,完成了电视/红外图像实时压缩解压缩处理器.该文的主
国企混合所有制改革是我国经济深化改革的一个重要举措,为了能够使国有企业稳定健康发展,要深入了解与掌握混合所有制在国有企业的改革发展中的重要意义,及时发现国企混改中
该文以在研雷达为背景,介绍了天波超视距雷达海杂波特性和海上目标检测存在的问题,采用实测数据对超分辨谱估计和杂波相消方法的应用进行了大量仿真和研究,提出了一种改善天