基于双麦克风的室内语音分离与声源定位研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:evaclamp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着麦克风阵列信号处理技术的不断发展和完善,各种新的理论和新的方法不断被提出。现在,麦克风阵列技术已经广泛应用于电话会议、室内外语音通信、人机语音交互等系统中。基于双麦克风的室内多声源信息感知系统,相比基于麦克风阵列或麦克风网络的系统,具有体积小、功耗少、成本低等特性,更适合智能产品小型化的发展趋势。然而,基于双麦克风的系统采集的信号样本维度比声源数量少(欠定问题),空间信息相对较少,可利用的其他信息也相对较少,如何在欠定情况下融合有限的信息,成为了研究的重点。因此,本文探讨双麦克风条件下的欠定混合信号的语音分离和声源定位问题,基于语音信号的时频特征和双麦克风的空间位置信息,提出了基于双麦克风的室内语音分离与声源定位系统。本文的主要工作为:1、针对传统的DUET(Degenerate Unmixing Estimation Technique)算法,为了进一步提高源信号的分离质量,对其进行了改进。首先,针对混合参数估计不精确的问题,利用MCFT(Multiresolution Common Fate Transform)变换代替STFT(Short-Time Fourier Transform)变换进行时频表示来构建二维直方图。其次,针对理想二进制时频掩码在分离时所产生的部分时频点丢失的问题,利用Gammatone滤波器将二进制时频掩码进行平滑处理,从而更好的重建源。本文采用SDR(Source to Distortion Ratio)、SAR(Source to Artifacts Ratio)和SIR(Source to Interferences Ratio)为评价指标,实验结果表明改进后的DUET算法与目前已有的算法相比,分离性能显著提升。2、为了探究利用两个麦克风进行多声源分离和二维平面定位的可能性,提出了一种基于双麦克风的室内语音分离与声源定位系统。系统根据麦克风采集的信号,建立了双麦克风时延-衰减模型,然后利用DUET算法估计了模型的时延-衰减参数,并绘制了参数直方图。在语音分离阶段,建立了二进制时频掩膜(Binary Time-Frequency Masking,BTFM),根据参数直方图,结合二值掩蔽的方法对混合语音进行了分离。在声源定位阶段,通过推导模型衰减参数与信号能量比之间的关系,得到了确定声源位置的数学方程组。利用Roomsimove工具箱模拟室内声学环境,通过MATLAB仿真和几何坐标计算,在对多个声源目标分离的同时完成了二维平面中的定位。实验结果表明,该系统对多个声源信号的定位误差均在2%以下。
其他文献
根据非常保守的估算,尚未包括汽车的钻石性物品效应,2000年北京市道路交通外部成本占GDP的份额介于1.745%~5.296%。若根据上下值的平均(3.52%)估计,北京每辆机动车每年的平均外部成本约为
目的:观察自拟方青城糊剂在四川汶川地震灾区湿疹治疗中的疗效。方法:将1381例湿疹患者随机分为治疗组889例,对照组492例。治疗组给予自拟青城糊剂外用,对照组给予皮炎平乳膏外用
通过CIMISS数据选取2018年望谟地区4个区域站及其以上9次短时强降水天气过程,通过分析祥雨D型双极化天气雷达(望谟X波段雷达)用户终端回波分析基本反射率、垂直最大反射率、V
十八大以来,国家高度重视社会公平问题。十八届三中全会强调要推动国民经济更高质量、更有效率、更加公平、更可持续发展。“十三五”规划中提出:要处理好公平和效率的关系,加强对再分配调节的力度,努力缩小全国各地之间的收入差距。十九大报告再次强调这一问题,提出要促进收入分配更加公平、更加合理,鼓励勤劳守法致富。1994年,我国进行了分税制改革,建立了市场经济条件下中央与地方财政分配关系的基本制度框架,促进了
目的:分析研究优质护理对于消毒供应中心的作用。方法:回顾性分析研究我院消毒供应中心护理人员护理情况,对比分析优质护理实施前后各项操作合格率、科室以及病房的满意情况。
目的本文通过系统药理学方法预测二仙汤治疗抑郁症的多成分、多靶点、多通路的作用机制。方法在TCMSP数据库中检索,得到二仙汤的化学成分及对应靶点,在DisGeNET数据库获取抑
立足于我国大型水陆两栖飞机研制项目管理实际需求,以项目管理5大过程组、民用飞机研制5个阶段、研发制造一体化管理模式下设置的9大业务域为不同维度,构建了民用飞机研制项
目的:本实验通过收集子宫内膜癌患者和正常对照组外周血,对比二者mdm2rs3730656和rs74099445两个SNPs位点差异,寻找子宫内膜癌发病风险的遗传标记物,为子宫内膜癌易感性的诊断做
图像处理技术自诞生以来在各个领域得到广泛的应用,但是随着社会发展,嵌入式系统,如A类点钞机系统,对识别准确率、接口吞吐率、处理速度要求越来越高,因此,对高识别准确率、高吞吐率、高处理速度图像处理技术的研究具有重要应用价值。本文首先针对图像分类的高准确率需求,使用基于LeNet-5图像的分类架构,设计FPGA实现的卷积计算模块,然后设计采用片上内存进行数据缓存的框架;其次,针对图像采集接口的高吞吐率
近些年,能源和环境问题日益受到社会的关注,清洁能源在船舶领域的应用逐步成为行业研究的热点。其中,燃料电池混合动力系统具有能量效率高、无污染等优点,但因锂电池的循环寿命短、功率密度低等缺点,限制了其系统性能的发挥。利用超级电容辅助锂电池工作,构成复合电源系统,使储能系统同时具有较高的能量密度与功率密度。本文以燃料电池-复合电源混合动力系统为研究对象,深入研究以能量效率、电能质量和电池耐久性等为优化指