低信噪比环境下语音可懂度增强算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:ysc4444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强技术通过去除语音中混杂的噪声干扰信号,提高去噪后的语音质量或可懂度。以往语音增强研究重点关注语音质量,增强算法通过抑制尽可能多的背景噪声来提高语音的听觉舒适度,对如何有效改善语音可懂度的研究相对较少,在低信噪比环境下提高语音可懂度相比语音质量提升更有应用价值。本文主要围绕改善语音可懂度的语音增强技术进行研究。主要研究工作如下:首先,提出了一种基于幅度谱失真控制的语音增强算法。由于在低信噪比环境下,先验信噪比估计误差和增益函数值放大失真会降低增强后语音的可懂度。为此,本文首先对先验信噪比估计值进行修正,再对过大的增益函数值进行约束控制,由此降低对可懂度的负面影响。另外,为对会损害语音可懂度的有害时频区域进行判断,本文对基于语音谱失真控制和基于噪声谱失真控制研究中的失真判别式进行推导,再利用这两个新得的判别式进行联合判断。在几种常见背景噪声的低信噪比情况下的实验结果表明,本文提出的算法对改善增强后语音的可懂度效果较好。其次,提出了一种基于联合失真控制的子空间语音增强算法。传统子空间增强算法在估计器的推导过程中,只考虑对误差信号中语音失真分量进行最小化,但误差信号中的残余噪声同样存在于增强后语音中,两者共同影响着增强后的语音质量和可懂度。为此,本文通过分别最小化语音失真分量和残余噪声分量,同时将幅度谱放大失真控制作为约束条件,将推导出的两个不同估计器进行加权求和,得到最终的增强估计器。实验结果表明,在不同信噪比和不同背景噪声下,经该算法去噪后的语音可懂度,要高于未处理的含噪语音和传统广义子空间方法处理后的语音。
其他文献
全球定位系统(GPS,Global Position System)是新一代的精密卫星定位系统。面对当前定位导航产品广阔的市场以及应用前景,研究GPS定位系统具有很大的现实及长远意义。另外,研
在图像和视频中添加字幕、图标或其它标签有助于人们对于图像和视频的理解,是图像和视频处理的基本操作之一,在影视播放、远程教学、医学图像处理、数字摄影、版权保护以及互
随着互联网技术的不断发展,Web服务作为一种新兴的Web应用模式,近年来得到快速发展与应用,Web服务数量逐渐增多。同时由于用户对服务功能与服务质量(Quality of Service, QoS
图像信息形象生动,被人类广泛应用。随着网络技术的迅猛发展,图像信息可以快速方便地在互联网上传播。但由于网络的不安全性,这些信息在传输过程中可能丢失或被破坏,不法分子
大量克隆代码所导致的一系列问题已经成为大规模软件开发、维护的主要障碍之一。为了更有效的检测出大型软件中的克隆代码以解决其带来的各种问题,各种克隆代码的自动检测工
聚类分析作为数据挖掘中的重要技术,具有广泛的应用领域。根据应用领域的不同,聚类算法被分为了四大类,其中包括划分方法、层次方法、基于网格的方法、基于密度的方法等。目
波兰学者Z.Pawlak,于1982年提出了粗糙集理论这种可以应用于众多领域的数学工具,该理论在无先验知识的基础上,通过对数据集的计算来解决实际问题。但该理论是建立在严格的包
计算机性能、网络技术和分布式通讯技术的迅速发展,促使企业信息系统结构呈现出异构、松散耦合、分布式的特点,给工作流管理系统提出了新的业务要求,而传统工作流管理系统中
海洋经济渔业资源是自然资源的重要组成部分,是人类食物的一个重要来源,它为从事捕鱼活动的人们提供了就业机会、经济利益和社会福利。随着“数字渔业”的提出,对经济渔业资源进
在图像处理与模式识别领域,图像数据量正以前所未有的速度增长,图像的维数也越来越高。然而,高维图像中包含大量冗余信息,极大增加了图像数据处理的难度,“维数灾难”由此产