语音增强技术的算法改进研究

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:pc84119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际的语音应用过程中,如语音通信、语音合成、语音识别等,所使用的语音信号不可避免的受到外来的各种各样的噪声干扰,这些干扰将严重影响语音设备功能的发挥。因此,有必要对被噪声干扰的语音信号进行去噪处理,即我们所说的语音增强。语音增强的算法多种多样。本文首先介绍了语音增强的来源、发展历程等,重点讨论了几种常用的基于短时谱的语音增强算法,以及语音和噪声模型,讨论了噪声估计的方法。一般的噪声估计是对噪声的方差进行估计,所估计的方差的准确性将对后续的处理有重大的影响。本文着重对基于最小值跟踪法的噪声估计做了详细的研究,通过实验仿真对其估计效果进行评价。最终以最小值跟踪算法作为改进的语音增强方法的噪声估计部分。本文主要是为了提高语音的清晰度,要求语音失真要小,并且减少“音乐噪声”对主观听觉的不良影响。利用人耳的语音感知特性,本文提出一种基于听觉掩蔽效应的改进谱相减语音增强方法。仿真结果表明:改进后的算法性能明显优于改进前的算法。在后续处理中,本文将基于人耳听觉的掩蔽效应引入增强系统中,最终试验表明掩蔽效应增加了语音的清晰度,提高了舒适度。
其他文献
便携式多媒体导航播放器(Portable Multimedia Navigator)已逐渐成为数码影音领域中便携式设备市场的主流。它结合了PMP(Portable Multimedia Player)的便携式娱乐音视频播放
基于智能体的电子商务是电子商务发展的必然趋势,基于智能体的电子商务自动协商研究是基于智能体的电子商务关键技术之一。在电子商务协商领域的研究中,网上拍卖以其特有的公开
在许多印刷和出版的应用中,基于对版权的保护和认证,需要将某些特征信息隐藏在半色调图像中。因此,对于半色调图像数字水印技术的研究就有着重要的意义。半色调图像数字水印
当前动态水印是数字水印领域一个重要的研究方向,其中包括音频、视频和图像等多种载体类别,由于它们算法实现都比较相似,冗余信息量非常大,非常有利于水印的加载,在市场运用中获得
CPU芯片应用验证是CPU设计过程中保证其可靠性的重要环节。随着芯片规模不断扩大,复杂度不断提高,验证成为现代化芯片设计中的一个重要瓶颈。本课题旨在设计SM8260应用验证硬件
随着互联网的迅猛发展,3G牌照即将发放,无线通信产品将为人们提供速率高达兆字节/秒的宽带多媒体业务,移动智能设备将变成集语音、图像、数据传输等诸多应用于一体的通信终端,这
随着工nternet的飞速发展,网络在线聊天已经迅速发展成为最普遍的网络交流方式之一。在线聊天具有的开放性(无需注册)、实时性、多话题交错等特点在使聊天室给用户提供了极大
随着对无线Ad Hoc网络研究的不断深入和无线网卡带宽的增加,Ad Hoc网络上传输实时多媒体业务成为了新的研究热点。实时视频传输要求路由协议能够找到传输稳定、带宽符合要求
随着Internet的高速发展,计算机病毒的传播速度和影响范围在不断增加,计算机病毒对计算机安全构成的威胁也日益突出。传统的病毒检测技术已无法有效地防御病毒,特别是未知病毒的
XML(eXtensible Markup Language)已经成为互联网上数据表示和交换事实上的标准,同时XML安全也引起了越来越多的关注,例如在Web服务中要求服务器拒绝未授权用户对敏感信息的访