基于分频谱减与传声器阵列的语音去混响

来源 :南京信息工程大学 | 被引量 : 1次 | 上传用户:suzuzl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声信号在封闭空间中传播经墙体、天花和地面的反射后晚于直达声到达人耳或拾音器,形成拖尾导致清晰的语音变得模糊,给人们的语言沟通,语音通信系统等带来不便。随着近年来科学技术的发展,语音增强技术与越来愈多的领域联系的更加紧密,例如语音识别、视讯会议等。去混响作为语音增强范畴内的一个技术难题,越来越受到语音信号处理领域的关注。本文主要从以下几个方面对去混响进行研究:(1)研究一般谱减法对混响抑制的效果。针对混响语音信号在每个频段上混响时间不同这一特性,将谱减用到每个频率子带中,提高谱减法去混响的精度。并分别采用语谱图和语音质量感知评价的评估方式对整体谱减法和分频谱减两种算法的效果作对比,发现分频谱减的去混响效果更为显著。(2)研究了延时求和去混响技术,将其运用在四通道传声器阵列上,应用不同的延迟求和方法:PHAT-DS (相位变换延时求和)、PBF-DS (相位误差滤波的多通道延时求和)、PBF-PHAT-DS (相位变换和相位误差滤波的多通道延时求和)对通道间的时延进行估计后,将各通道间语音信号对齐、求和使得四通道传声器阵列的主瓣对准直达声的入射角度。进行了不同场景的数据搜集实验,并具体介绍了实验流程和规范,降低了数据采集过程中产生的误差。之后使用实测数据对上述三种算法进行横向对比,结果发现PBF-PHAT-DS效果更为明显。(3)将线性预测技术运用到去混响中,考虑到封闭空间脉冲响应的变化速率远低于人发声时声道脉冲响应的变化速率,依据最小均方误差准则设计了针对封闭空间混响系统的均衡器。并结合语音识别系统对于中后期混响较为敏感的特点设计了基于加权的最小均方误差均衡器。仿真结果显示基于加权最小均方误差均衡器的使用明显地抑制了中后期的混响能量。
其他文献
从凸函数的一种定义出发,推导出凸函数的一个性质定理;将该性质定理中的凸函数代入某些具体函数,就会得到许多很有用的不等式。
经济文本在当代经济社会中非常常见。这类文本有其独特的特点,例如多术语、专有名词,缩略语使用十分频繁、多名词化结构、以及学科交叉性等。是一种专业性很强的正式文体。笔者通过自己做的一篇名为《企业治理与区块链》的翻译实践,对整个翻译过程进行了具体的介绍,包括译前准备,翻译和译后修改。在这个过程中,笔者试图探索翻译经济文本的难点以及相应应对措施,希望此次翻译实践能够帮助探索翻译一般经济文本的原则和技巧,并
在经济社会发展过程中,城乡关系是一对十分重要的关系,正确认识和处理城乡关系,是新时期,尤其是在改革的攻坚时期,是我国经济社会继续稳定发展的重要保证。对马克思主义城乡
本文针对新时期高校成人教育管理队伍的建设问题进行了深入的研究,其中包括建设高校成人教育管理队伍的重要性、开展高校成人教育管理队伍建设中所出现的问题以及如何加强高
本文从土壤侵蚀的环境背景、侵蚀能力的力学原理、土壤潜在侵蚀面等几个方面,分析了黄土残塬沟壑区的侵蚀,得出黄土残塬沟壑区具有土壤侵蚀形成并趋于严重的条件。选定典型区域
微博的快捷特征与"时尚"的流行特征天然吻合,使之成为时尚传播的有效媒介。微博主在传播时尚的过程中,能够获得自尊或归属感,产生身份意义上的自我认同或社会认同。本文着重
近年来,自媒体经过不断发展逐渐成长为独具特色的新闻力量。为了适应不一样的传播环境和用户诉求,自媒体在传统新闻理念的基础上,拓展出了一套新的话语方式,并通过强化立场、
植被净初级生产力(Net primary production,NPP)是陆地生态系统碳循环的重要组成部分,在全球碳平衡中起着重要的作用。滇西北高原纳帕海湿地具有重要的碳汇功能,对于保障国家
利用化工流程模拟软件PRO/II,以甲醇为萃取剂,对氯甲烷-二甲醚萃取精馏分离进行了模拟研究,详细分析了理论板数、进料位置、溶剂比和回流比的影响,最优工艺方案为:理论板数90
随着世界各国间的经济联系日益密切,海洋经济的发展和资源的不断开发利用,人们对海洋环境的保护愈加重视。文中从发展远洋运输的重要性出发引起的海洋环境污染,主要污染来源