室内环境下的麦克风阵列语音增强算法研究与硬件实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:redlong888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技发展,语音信号已经成为人机交互的重要媒介。麦克风阵列相对于传统的单通道麦克风系统,具有空间指向性及高信号增益特性,可以更有效地拾取目标语音信息,被广泛应用于智能家居、可穿戴设备等语音处理系统中。在室内环境中,麦克风阵列工作性能会因房间混响以及各种噪声的干扰而下降,影响人机交互的体验。针对上述问题,本文提出了一种新的麦克风阵列语音增强方法:使用小波变换对传统广义旁瓣抵消器(GSC)结构语音增强算法进行优化,使用卷积神经网络语音增强算法作为后置语音增强算法。提出的改进算法将在FPGA实现硬件加速并验证功能。本文的主要工作有:(1)室内环境中,GSC结构中的阻塞矩阵无法完全阻塞目标语音信号,从而造成语音泄露,影响语音增强的效果。针对此问题,本文提出了一种基于小波变换的GSC语音增强方法:使用小波变换替代阻塞矩阵,通过对麦克风阵列中各通道信号进行小波分解与重构提取各通道的噪声信号,减少语音泄露。(2)GSC结构的语音增强算法能够有效地抑制空间中的相干噪声,但会残留较多的非相干和弱相干噪声。针对此问题,本文采用卷积神经网络语音增强算法作为后置语音增强算法,提高算法对不同种类噪声的抑制能力。(3)对所提出的麦克风阵列语音增强算法进行实验仿真,并与部分现有文献中的算法在不同噪声环境中进行性能对比。实验表明,在-10d B-10d B信噪比范围内,在高斯白噪声与人声干扰下,所提出算法的语音感知质量评价(PESQ)平均得分提高了24.48%;在Babble噪声与人声干扰下,所提出算法的PESQ平均得分提高了17.44%;在pink噪声与人声干扰下,所提出的算法PESQ平均得分提高了21.09%;在实地获取的室内环境噪声中,所提出的算法PESQ平均得分提高了18.74%。(4)所提出的算法硬件验证结果表明,FPGA的输出结果与软件算法的输出结果基本一致,最大误差为2-11,PESQ得分下降了2.65%,在误差范围内证明了硬件实现功能的正确性。
其他文献
2002年釜山亚运会惨败后,中国网球开始改革并取得了显著的进步,尤其是在女子双打方面,但是总体来说,我国网球项目整体实力与国际上网球强国还有一定距离。随着一批优秀运动员
实验研究了水包油型乳化液油滴在管内节流元件处的破碎行为,分析了破碎机理.结果表明,液滴破碎主要发生在节流元件内壁及下游附近,其概率是施于液滴上湍流应力与液滴表面能之
[目的]探讨非血液系统恶性肿瘤的患者并发急性肾损伤(acute kidney injury,AKI)的相关危险因素及影响其预后的相关因素。为临床工作中预防非血液系统恶性肿瘤病人AKI的发生提
欧盟扩张不仅对世界经济的发展产生了重大影响,而且对国际会计的战略布局形成了新的冲击.庞大的欧盟经济实体,将使全球会计统一化的趋势得到迅速推进.欧盟扩张及全面适用国际
分析风险的危害性和可控性,并提出化解风险,准确评价的原则和对策,同时还提出了通过完善配套法规、分类建立党政领导干部经济责任量化指标,形成规范的评价标准等建议.
本文论述了新善本的概念及鉴定标准,分析了新善本工作在图书馆实践中的作用和意义,进而探讨了图书馆应如何开展新善本工作.