复杂环境下的近场声源定位技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：jifeng11111

【摘要】

：

基于麦克风阵列的声源定位和语音增强技术是目前语音信号处理领域的研究热点之一。在视频会议系统，语音识别系统和助听装置等方面，可以通过麦克风阵列声源定位方法来确定说话人

【作者】

：

张大威

【机构】

：

北京工业大学

【出处】

：

北京工业大学

【发表日期】

：

2013年01期

【关键词】

：

麦克风阵列时延估计声源定位语音增强复杂环境

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

基于麦克风阵列的声源定位和语音增强技术是目前语音信号处理领域的研究热点之一。在视频会议系统，语音识别系统和助听装置等方面，可以通过麦克风阵列声源定位方法来确定说话人的位置。但环境噪声和房间混响的存在将会严重影响现有声源定位方法的性能。本文针对上述问题，研究并实现了一种鲁棒的时延估计方法，并将其与线性定位法相结合，组成一套声源定位系统，可以获得较高的定位精度。将这套系统应用于现有麦克风阵列语音增强方法的前端，与传统的声源定位方法相比，可以更有效地抑制背景噪声和混响，同时提高语音客观质量。本文所构建的基于麦克风阵列的声源定位和语音增强方法主要包含时延估计、声源定位和语音增强三个模块。首先，利用统计模型和传递函数比（AcousticalTransfer Function, ATF）相结合的方法获得两路信号的时延估计值；然后根据所得时延估计，采用线性定位方法确定声源的位置信息；最后，将声源位置输入到语音增强模块中，便可得到增强后的语音信号。本文所提时延估计方法在传统ATF方法基础上进行改进，首先采用最小值控制递归平均（Minima-Controlled RecursiveAveraging, MCRA）方法估计背景噪声，采用加权欧式失真测度（Weighted Euclidean Distortion Measure, WEDM）估计器去除接收信号中的噪声，从而降低噪声对传递函数的影响；而后将两路信号互功率谱的平滑和白化引入ATF方法中，更好的去除混响对传递函数的影响，进一步利用话音激活检测（Voice Activity Detection, VAD）方法去除对求取传递函数无用的噪声段，以提高时延估计的准确性。实验结果显示，在具有强噪声和强混响的复杂环境下本文所提方法具有很好的性能，且明显优于传统的时延估计方法。本文采用经典的——广义旁瓣抵消（Generalized Sidelobe Canceller, GSC）方法作为语音增强模块，并选择三种客观指标，包括分段信噪比（Segmental Signalto Noise Ratio, SegSNR）、对数谱失真（Log-Spectral Distortion, LSD）和语音质量感知评价（Perceptual Evaluation of Speech Quality, PESQ）来评价增强语音的性能。测试结果表明，与传统的ATF和广义互相关函数（Generalized CrossCorrelation, GCC）算法相比，采用本文所提的算法能更准确的提供声源位置信息，并有效提高增强语音的客观质量。

其他文献

亨廷顿蛋白在DNA损伤应答中的功能研究

亨廷顿舞蹈病(Huntingtons Disease，HD)是一种罕见的常染色体显性遗传神经退行性疾病，其主要特点是躯体和四肢不可控制的舞蹈样运动，渐进性认知能力下降和精神障碍以及痴呆，主要

学位

亨廷顿舞蹈病发病机理DNA损伤应答机制亨廷顿蛋白

用人单位劳动合同期限管理中的误区及应对思路

劳动法颁发后,用人单位的劳动关系管理促使各个方面影响颇多,包含了单位以前的管理、公司制度、招聘制度、和薪金制度以及最新的劳动法管理方法等.为了执行最新的劳动法改变

期刊

用工企业新劳动合同法企业的管理思路及误区

诱导性肝脏炎症损伤的病理机制和18β甘草次酸干预研究

18β甘草次酸(18β-glycyrrhetinic acid,GA)传统中药甘草主要的活性成分,在肝脏保护和抗炎症方面发挥了非常重要的作用,但是GA发挥这些药理作用的分子机制尚不清楚。在本项

学位

甘丙肽2型受体在HEK293细胞中的表达及转运机制

甘丙肽(galanin)是脑内重要的神经肽之一,由29个氨基酸(人类是30个氨基酸)组成。甘丙肽受体的三个亚型已被克隆,分别是甘丙肽1型受体(GalR1),甘丙肽2型受体(GalR2)和甘丙肽3

学位

甘丙肽2型受体膜转运HEK293细胞系

新型凹栅增强型AlGaN/GaNMIS-HEMT器件研究

氮化镓(GaN)基高电子迁移率晶体管(HEMT)由于其高电子迁移率、高电流密度和高耐压等优异特性而受到广泛关注，作为下一代功率器件强有力的候选者，GaN基HEMT器件具有很好的应用前

学位

氮化镓晶体管制造工艺凹栅结构电学性能

扩铂与高能电子辐照结合的寿命控制技术对FRD的影响及机理研究

快恢复二极管(FRD)是电力电子系统中重要的开关器件，它的应用十分广泛。随着人们对开关器件的开关速度需求的提高，对FRD的性能的需求也不断提高。所以，提高FRD的性能对电力电子

学位

快恢复二极管反向恢复时间寿命控制扩铂电子辐照

炎性信号和BLOS2调控小鼠造血干细胞发育的机制研究

造血干细胞(hematopoietic stem cells，HSCs)是血液系统中所有血细胞的始祖细胞，具备自我更新和多向分化的潜能。造血干细胞功能异常是许多血液系统疾病的根源。脊椎动物胚胎期

学位

造血干细胞炎性信号Bloc1s2基因调控机制

小鼠心肌SCN5A基因在低硒与高硒时的选择性剪接

目的：研究小鼠心肌SCN5A基因在低硒和高硒状态下表达量的变化以及SCN5A基因是否发生选择性剪接。　　方法：应用低硒合成饲料和饮水中加亚硒酸钠的方法，喂养4周龄C57BL雄性小鼠

学位

SCN5A基因低硒高硒模型选择性剪接动物实验

情境教学在初中物理教学中的运用

本文通过对荣华二采区10

期刊

阿拉善荒漠植物干旱休眠机理研究

水分是限制荒漠植物生长的主要因子,荒漠植物对极端干旱有独特的适应方式,有些植物能通过休眠来减轻胁迫而适应干旱环境。生理学上认为植物夏季休眠是某些植物的一种生存机制

学位

荒漠植物干旱休眠干旱胁迫脱落酸海藻糖脯氨酸甜菜碱

复杂环境下的近场声源定位技术研究

与本文相关的学术论文