基于双耳空间信息的语音分离研究

来源 :东南大学 | 被引量 : 0次 | 上传用户：ciweiqiu

【摘要】

：

语音分离技术尤其是基于人耳听觉的语音分离技术,在语音增强、语音识别和助听器等语音信号处理领域具有重要的地位。本文以双耳空间信息为基础,结合语音信号的稀疏性,提出了

【作者】

：

李枭雄

【机构】

：

东南大学

【出处】

：

东南大学

【发表日期】

：

2015年期

【关键词】

：

双耳声源定位盲源分离语音分离二进制掩码压缩感知

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音分离技术尤其是基于人耳听觉的语音分离技术,在语音增强、语音识别和助听器等语音信号处理领域具有重要的地位。本文以双耳空间信息为基础,结合语音信号的稀疏性,提出了两种基于双耳定位的语音分离方法：基于时频掩蔽的语音分离和基于压缩感知的语音分离。对于基于空间信息的多声源混合语音分离,论文主要做了以下几方面的工作：(1)分析了双耳定位的语音分离的研究思路。空间听觉是人耳听觉的一个重要特性,多声源环境下,人耳听觉系统首先整合声源的空间信息,经由大脑的中枢神经,进行定位及分离,本文根据该特性,提出了先通过双耳定位算法对多声源进行定位,再根据定位结果进行语音分离的思路。(2)研究了双耳多声源定位算法。通过对耳间时间差和耳间强度差两个声源定位线索进行模型训练,建立方位映射模型,将多声源混合语音进行参数提取,通过耳间时间差与耳间强度差的联合判定,获取多声源定位结果,包括声源个数及其对应的水平面上的角度。实验结果表明,该定位算法对单声源至多声源定位有较高的定位准确度。(3)提出了基于双耳定位结果的时频掩蔽语音分离算法。在多声源环境下,在频域的同一频点,能量最大的声源将掩蔽其它能量较小的声源,最终只有一个信号占主导,本文依据语音信号的频域稀疏性,根据声源定位的结果,将所有时频点都划分为离该时频点距离最近的声源,将每个声源所划分到的时频点进行时域转换,获得该声源的分离信号。基于双耳定位的时频掩蔽语音分离其实验结果要明显优于同类算法。(4)提出了基于双耳定位结果的压缩感知语音分离算法。本文分析了基于双耳的多声源混合模型,其形式与基本的压缩感知模型是相一致的,因此,本文利用双耳定位结果、声源的字典信息和混合语音构建出压缩感知模型,采用正交匹配追踪算法对多声源混合语音进行重构,实验结果表明,语音分离指标SIR、SNR与时频掩蔽方法相比获得有效提高。

其他文献

基于无线传感器网络的甲醛实时监测系统

室内空气质量与人的健康有密切的关系，作为装修与家具主要材料的人造板材由于甲醛浓度超标成为室内空气污染的主要因素。从源头上控制甲醛的浓度，不但能减少对人造板材企业的利

学位

无线传感器网络甲醛检测实时监测系统室内装修网络数据采集

声呐自噪声仿真方法及其计算机实现

声呐是舰船上重要的电子设备,它通过处理接收到的目标声信号来实现对目标的探测、定位和识别等。然而声呐会受到其所在环境的各种噪声源的干扰,声呐平台的机械噪声、螺旋桨噪

学位

声呐声呐自噪声舰船辐射噪声海洋环境噪声流噪声

高精度溶解氧测量仪的研究与设计

溶解氧(Dissolved Oxygen，DO)是指溶解于水中分子态的氧，是水生生物生存不可缺少的条件，也是水体受有机污染程度的重要指标。快速、准确、连续测量水体溶解氧的含量，对工农业生产

学位

溶解氧电极测氧核心处理器电化学传感器测量精度在线连续监测

智能配用电通信网测试系统研究

随着智能电网的发展,电网的智能化逐步覆盖从发电端至用户端之间的各个环节,并具有可观测特性、可控制特性、自适应特性以及自愈性特性,而配用电网与用户用电服务直接相关,是当前电网智能化发展的研究关键点与难点。依托电力流传输与控制,采用信息与通信融合的新技术是实现配用电网智能化的技术切合点,依据所承载的业务信息同时具有工业传输控制及电力流结构特征,采用一张具有高传输性能、安全性能及平台化的通信网是实现配用

学位

智能电网配用电通信传输规约业务建模测试系统

河南造纸行业5个产品被认定为河南省名牌产品/广东质监局公布2013年广东省生活用纸产品质量专项监督抽查结果/4项造纸国家标准获批

期刊

河南省造纸行业名牌产品广东省生活用纸产品质量专项监督抽查结果

环保部支持新乡县2家造纸企业进行二恶英减排示范改造/广东碳交易试点预计年底启动/2013年7-8月份我国造纸行业主要产品产量

期刊