基于麦克风阵列的语音增强实现

来源 :东南大学 | 被引量 : 0次 | 上传用户：lunxyxd

【摘要】

：

本文主要研究了基于麦克风阵列的声源定位及语音增强的关键技术并实现算法。声源定位是语音增强的前提，因此准确获取声源的方位信息显得至关重要。　　论文首先详细阐述了基于

【作者】

：

程超

【机构】

：

东南大学

【出处】

：

东南大学

【发表日期】

：

2013年期

【关键词】

：

麦克风阵列声源定位语音增强质量评估延迟累加波束形成

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文主要研究了基于麦克风阵列的声源定位及语音增强的关键技术并实现算法。声源定位是语音增强的前提，因此准确获取声源的方位信息显得至关重要。　　论文首先详细阐述了基于相位变换加权的广义互相关(GCC-PHAT:GeneralizedCrossCorrelation-PhaseTransform)时延差估计法、基于相位变换加权的可控响应功率(SRP-PHAT:SteeredResponsePower-PhaseTransform)声源定位算法。然后，论文详细介绍了基于波束形成的延迟累加波束形成(DSB:Delay-SumBeamforming)语音增强算法的原理。在此基础上，给出了系统定位、增强部分的软件流图:将SRP-PHAT算法从空间和频域角度离散化，实现了SRP-PHAT-D(SRP-PHATAlgorithmBasedonDiscreteTimeDelay)算法，利用定位结果获得时延矢量参数，并将时延矢量参数传递给DSB算法，实现语音增强。其中，为提升运算效率，计算GCC-PHAT时，我们引入了FFTW(FasterFourierTransformintheWest)库函数做傅立叶变换。　　本文采用4个全向麦克风构成半径为10cm的均匀圆阵。结合NIPXI4498采集设备及PC处理机搭建了一个实时的语音增强系统，并给出了在实际环境中的测试结果。论文采用PESQ(PESQ:PerceptualEvaluationofSpeechQuality)标准评估语音质量。测试表明SRP-PHAT算法在高信噪比、中度混响环境下，有着较好的性能;在信噪比分别约为-5dB，0dB，5dB，10dB的实际环境中，DSB算法均有着不同程度的性能提升，达到了预期效果。

其他文献

基于机器视觉的车流量检测算法研究及DSP实现

智能交通系统(ITS)是目前各国交通运输部门竞相研究和开发的热点，而车流量检测是智能交通系统的主要研究领域。目前大多数的车流量检测算法主要是在计算机平台进行仿真，移植到D

学位

车流量检测DM6437开发平台高斯混合模型智能交通系统机器视觉

基于几何图的人脸识别算法研究

人脸识别系统已受到社会各界的普遍重视，在最新的模式识别研究中,“人脸识别”成为一个新的研究热点，其应用范围不断扩大，在很多领域的应用和在某些限定的条件下对人脸进行识别

学位

人脸识别图匹配特征提取特征点归一化

移动互联网服务资源管理关键技术的研究与实现

由于网络的融合，提供移动服务的终端变得多元化，因而移动互联网提供的服务资源具有多样性，且数量巨大，这些资源结构各异，而且有些服务的功能具有很大的相似性，因此，需要对这些服务资

学位

WebService元数据服务质量服务组合服务选择

探究生本教育理念下班级文化建设中的德育渗透

作为现代教育理念,生本教育理念在教学管理活动中有着广泛的应用空间.在班级管理体系中,班级文化建设具有重要意义,在班级文化建设中融入德育教育,进行德育渗透,可以提升德育

期刊

生本理念班级文化文化建设德育渗透

多组多播网络中继位置和中继选择的研究

当前,移动设备的智能性越来越高,其应用已经不再仅仅局限于传统的点对点的通信,而是拓展到人们生活的方方面面。最新调查报告显示,截止2016年8月,我国网民数量已经到达7.1亿,

学位

协作通信多组多播中继位置中继选择

中继波分多址系统中共道干扰的抑制

以往的中继空分多址研究方案需要对信道信息进行反馈,并且将共道用户配置到同一中继站。由于共道用户之间的距离过近,导致共道干扰难以被有效抑制,所以空分多址(SDMA)处理提

学位

中继波分多址系统无线资源分配用户配置共道干扰抑制频谱效率

基于窃听信道模型的保密传输设计与性能分析

无线通信系统具有开放性,随着通信业务逐渐丰富,信息安全事故频繁发生。计算机性能在不断提升,导致依赖于计算量和复杂度的上层安全措施越来越不可靠。于是,近年来物理层安全

学位

窃听信道模型物理层安全Nakagami-m衰落天线相关性qth天线选择

基于FRFT算法降低CO-OFDM通信系统峰值平均功率比的研究

光正交频分复用(OOFDM)技术是正交频分复用(OFDM)技术在光通信系统中的一类新型技术。相干光正交频分复用(CO-OFDM)技术是OOFDM技术中的一类，相干光通信和OFDM之间相互促进，OFD

学位

相干光正交频分复用峰值平均功率比分数阶傅里叶变换

可用作差分功放谐振电感的RFID标签天线的设计

射频识别（RFID，Radio Frequency Identification）技术是利用无线射频方式进行非接触双向通信，从而达到自动识别目标对象并获取相关数据的技术。　　与其它识别技术相比，RFID技术具

学位

射频识别标签天线差分功率放大器谐振电感

结合多尺度分析与各向异性扩散的超声图像去噪算法

医学超声图像去噪的问题,越来越受到重视。但由于系统和环境等因素的影响,使得采集到的图像存在大量的噪声,影响图像视觉效果,直接影响后续工作的开展,因此超声图像的去噪声

学位

超声图像去噪多尺度分析各向异性扩散滤波SRAD模型

基于麦克风阵列的语音增强实现

与本文相关的学术论文