统计模型语音增强算法研究

来源 :烟台大学 | 被引量 : 0次 | 上传用户:luckycpw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实环境中,语音在传输的过程中往往会受到外界噪声的影响而造成语音处理产品执行非期望的指令。为了减小或消除语音中混有的噪声,就需要对带噪语音信号进行增强处理,使其恢复出原始信号,最终提高语音的通信质量。语音增强处理方法常分为时间域内的消噪法、变换域内去噪法以及其它方法。其中,由于变换域中语音分量和噪声分量之间的特征信息相对于时域中信号分量会产生较大的不同,因此更有利于对带噪语音信号中的噪声消除,使得变换域语音增强算法成为语音增强技术中的研究重点。首先,本论文介绍了先验信噪比的估计问题,通过在直接判决算法基础上引入一个动量项,提出一种新的先验信噪比估计算法,提出的方法提高了直接判决算法跟踪瞬时信噪比的能力,减小了延迟。之后提出的两步噪声消除算法虽具有较好的降低直接判决方法中的延迟问题,但却削弱了消除背景噪声的能力,并且对于直接判决方法中延迟的消除情况仍存在不足。为了减小上述问题对算法性能的影响,论文又提出了一种改进的两步噪声消除算法,其通过将实际语音与其估计值之间的误差补偿到输出信号,从而改善算法的增强效果。其次,论文在采用拉普拉斯模型来近似实际语音模型的基础上进行语音增强算法的研究,给出了拉普拉斯-高斯联合分布下对实际语音信号做出的两种(MMSE和ML)估计式。分析了拉普拉斯模型因子对该类算法性能的影响,并在以上分析的基础上推导出一种新的模型因子估计形式,新形式考虑了拉普拉斯模型的先验假设条件,能够获得更为准确的模型因子估计值,有效提高相应算法的性能。随后讨论了最小值统计跟踪算法的缺点和优点,针对其存在的不足,分别从考虑高斯和拉普拉斯两种模型对原始算法进行改进,获得基于语音模型的最小值统计跟踪算法,仿真实验验证了改进算法具有较好的性能。再次,论文给出了本文主要提出的耦合模型算法。讨论并分析了变换域中噪声分量和语音分量的实际模型分布情况,并得出实际语音的统计分布并不能由单一的模型参数来准确估计,而是在不同时刻和不同频点上具有不同的统计分布。综合以上分析,提出采用耦合模型的形式来取代以往单一模型近似实际模型的方式,最终为基于语音统计算法的研究提供了一个更为理想的研究背景。基于以上分析,本章节通过耦合高斯和拉普拉斯模型来介绍耦合性算法的优势,并相应的提出几种耦合条件下的语音增强算法来验证所提思想的可实用性。最后,进行了总结,并对今后的研究状况做出分析。
其他文献
数字图像修复是数字图像处理领域一个重要分支,它的主要思想是利用图像中的已知信息,按照一定的规则自动的修复图像中遗失的或者损坏的区域,并且使修复后的图像尽可能的接近或达
随着第三代移动通信技术(3rd-Generation,3G)、无线局域网(Wireless LocalArea Networks, WLAN)的不断发展及用户需求的增加,用户要求能够在不同种类的网络中畅游,享受稳定、快速的
随着现代计算机技术的飞速发展,人和机器之间的交流也日趋频繁,很多依靠普通人力无法实现的功能都需要借助机器来完成。如何让机器更快更好的执行人的指令,逐渐成为研究的一
移动性负载均衡技术是LTE系统自组织网络中的热点用例之一。它可以提高网络资源利用率,提升系统吞吐量,增强网络灵活性。其基本原理是通过调节小区的移动性参数,实现小区间负载
正电子发射断层成像(Positron Emission Tomography,PET)是核医学领域最先进的技术之一,它利用注入体内的放射性核素来进行显像,可以动态地反映生物体的生理、生化信息。正电子成
心音是在心血管系统疾病诊断中不可缺少的重要生理指标。目前,通过心音检测和分析可以得到关于心脏疾病的重要信息,这对于心脏疾病诊断中具有很重要的临床意义。因此,对于心音检
飞行器再入大气层时会遇到“黑障问题”,此时,飞行器的状态无法实时监测,对其安全构成了很大的威胁,因此“黑障问题”是遥测系统亟待解决的主要问题之一。要解决飞行器的“黑障问
MIMO (Multiple-Input Multiple-Output)技术能够显著的提高系统的性能,扩大覆盖范围,已经受到广泛的关注。但是,移动终端由于受到其体积、功率的限制,制约了MIMO技术的应用。协
为解决移动通信系统中频谱资源与系统容量之间的矛盾,小区半径不断减小,出现了微蜂窝、微微蜂窝。典型微蜂窝往往位于城市建筑物“峡谷”或室内,基站天线和接收天线低于周围建筑
图像超分辨率重建是一种重要的数字图像处理技术,被广泛地应用于安防、个人图像处理、医疗图像处理、卫星遥感成像等领域。低分辨率图像会对图像中感兴趣的目标识别造成一定的