基于麦克风阵列的语音增强实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:lunxyxd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究了基于麦克风阵列的声源定位及语音增强的关键技术并实现算法。声源定位是语音增强的前提,因此准确获取声源的方位信息显得至关重要。  论文首先详细阐述了基于相位变换加权的广义互相关(GCC-PHAT:GeneralizedCrossCorrelation-PhaseTransform)时延差估计法、基于相位变换加权的可控响应功率(SRP-PHAT:SteeredResponsePower-PhaseTransform)声源定位算法。然后,论文详细介绍了基于波束形成的延迟累加波束形成(DSB:Delay-SumBeamforming)语音增强算法的原理。在此基础上,给出了系统定位、增强部分的软件流图:将SRP-PHAT算法从空间和频域角度离散化,实现了SRP-PHAT-D(SRP-PHATAlgorithmBasedonDiscreteTimeDelay)算法,利用定位结果获得时延矢量参数,并将时延矢量参数传递给DSB算法,实现语音增强。其中,为提升运算效率,计算GCC-PHAT时,我们引入了FFTW(FasterFourierTransformintheWest)库函数做傅立叶变换。  本文采用4个全向麦克风构成半径为10cm的均匀圆阵。结合NIPXI4498采集设备及PC处理机搭建了一个实时的语音增强系统,并给出了在实际环境中的测试结果。论文采用PESQ(PESQ:PerceptualEvaluationofSpeechQuality)标准评估语音质量。测试表明SRP-PHAT算法在高信噪比、中度混响环境下,有着较好的性能;在信噪比分别约为-5dB,0dB,5dB,10dB的实际环境中,DSB算法均有着不同程度的性能提升,达到了预期效果。
其他文献
智能交通系统(ITS)是目前各国交通运输部门竞相研究和开发的热点,而车流量检测是智能交通系统的主要研究领域。目前大多数的车流量检测算法主要是在计算机平台进行仿真,移植到D
人脸识别系统已受到社会各界的普遍重视,在最新的模式识别研究中,“人脸识别”成为一个新的研究热点,其应用范围不断扩大,在很多领域的应用和在某些限定的条件下对人脸进行识别
由于网络的融合,提供移动服务的终端变得多元化,因而移动互联网提供的服务资源具有多样性,且数量巨大,这些资源结构各异,而且有些服务的功能具有很大的相似性,因此,需要对这些服务资
作为现代教育理念,生本教育理念在教学管理活动中有着广泛的应用空间.在班级管理体系中,班级文化建设具有重要意义,在班级文化建设中融入德育教育,进行德育渗透,可以提升德育
当前,移动设备的智能性越来越高,其应用已经不再仅仅局限于传统的点对点的通信,而是拓展到人们生活的方方面面。最新调查报告显示,截止2016年8月,我国网民数量已经到达7.1亿,
以往的中继空分多址研究方案需要对信道信息进行反馈,并且将共道用户配置到同一中继站。由于共道用户之间的距离过近,导致共道干扰难以被有效抑制,所以空分多址(SDMA)处理提
无线通信系统具有开放性,随着通信业务逐渐丰富,信息安全事故频繁发生。计算机性能在不断提升,导致依赖于计算量和复杂度的上层安全措施越来越不可靠。于是,近年来物理层安全
光正交频分复用(OOFDM)技术是正交频分复用(OFDM)技术在光通信系统中的一类新型技术。相干光正交频分复用(CO-OFDM)技术是OOFDM技术中的一类,相干光通信和OFDM之间相互促进,OFD
射频识别(RFID,Radio Frequency Identification)技术是利用无线射频方式进行非接触双向通信,从而达到自动识别目标对象并获取相关数据的技术。  与其它识别技术相比,RFID技术具
医学超声图像去噪的问题,越来越受到重视。但由于系统和环境等因素的影响,使得采集到的图像存在大量的噪声,影响图像视觉效果,直接影响后续工作的开展,因此超声图像的去噪声