网络语音传输丢包的恢复技术

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:znaddh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音通信对实时性和连续性都有较高要求,但现在的网络(IPv4)只提供一种尽力而为(Best-effort)的服务,网络拥塞的发生会导致丢包和延时,从而使得话音质量严重下降,因此为了确保服务质量(Quality of Service,QoS),需要采取应对策略来降低丢包和延时对语音质量造成的不良影响。基于接收端的语音丢包恢复策略已经成为一个决定通信话音质量的重要因素。本文主要研究基于接收端的语音丢包恢复技术,改进和设计了一系列的算法实现对码激励线性预测编码(Code Excited Linear Predictive Coding,简称CELP)框架的语音丢失帧的恢复来改善话音质量。首先研究了应用广泛的CELP框架编码器和G.723.1语音编码,设计了一个丢包模型来较好的模拟网络丢包状况,从而能够在此模型上实现丢包恢复算法。然后先探讨了在时域波形上的语音丢包恢复算法,以及在CELP的参数域上的基于参数复制和交叠插值方法的丢包恢复算法,在此基础上改进和设计了基于声音驱动的丢包补偿算法,其相比较之前的恢复算法对清浊音判断和转接段估计,语音信号幅值的趋势变化几个方面进行了更精确处理,并使用信噪比评价实验结果验证了其更好的恢复效果。之前的丢包恢复算法都忽视了语音信号的统计学变化规律会导致恢复信号在听觉感官上的不自然。针对这一问题,我们引入了统计学方法,不再把丢失帧参数看成是一个确定值而是一个混合高斯分布GMM(Gaussian Mixture Model),并利用HMM(Hidden Markov Model)来描述语音信号的随机变化过程,从概率上来估计丢失语音参数,在理论上对于丢失帧的恢复能得到更好的听觉效果。最后使用巴克谱失真这种接近感官听觉标准的语音质量的客观评价方法来对我们的算法进行评价。实验结果表明,引入基于HMM模型的丢包恢复算法相比之前的恢复算法具有更好的恢复效果。
其他文献
图像是因特网上内容的一个重要组成部分,它能够直接、形象的表达信息。随着数字照相设备和具有拍照功能的手机的普及,数字图像的数量正在急剧的膨胀。与此同时,图像信息的应
车载自组织网络的一个重要特征是车辆节点具有很快的移动速度,尤其在高速公路场景中。车辆节点的快速移动特性,造成车载网络拓扑结构的动态变化,导致自组织网络中多跳(multi-
在软件开发中,开发人员在调试时花了大量时间。普通的调试器提供了很多帮助,但是调试仍然是一项艰巨的任务。为此开发人员提出了基于快照的回溯调试技术,其中的快照技术很多
当人们生活快速发展的同时,无线通信技术也随着快速发展,频谱资源的匮乏和无线应用需求持续增长的冲突越来越明显。认知无线电技术为了解决频谱资源利用率的问题应用而生。该技
目标检测历来被认为是一个十分复杂的问题,同时也是图像理论发展的瓶颈之一。小波变换和分形理论的提出拓宽了人们的视野。基于小波变换的目标检测是利用小波变换的多分辨率
VC-1是2003年微软在WMV9(Windows Media Video 9)基础上提出的视频压缩技术,2006年4月,SMPTE正式颁布了VC-1视频编码标准,并随后发布了解码算法的参考模型。VC-1整合了MPEG及
随着通信技术、嵌入式计算技术和传感器技术的飞速发展和日益成熟,无线传感器网络在军事、环境监测、医疗护理、空间探索等方面都显示了广阔的应用前景,被认为是21世纪最有发
大数据、云计算以及目前类型众多的网络业务的出现,导致传统电信网络的劣势越来越突出。光交换技术的灵活性以及光传输介质(光纤)的大容量、低损耗等优点使得全光网络相比于传统
数据是当今信息社会宝贵的资源,发现并利用潜藏在那些复杂数据集中的有用知识已成为科学决策的前提。数据挖掘技术通过关联规则、聚类及分类等方法实现从大量的、不完全的、
Web Services是一种崭新的分布式计算模型,它由一系列相关技术和标准组成,如XML、SOAP、WSDL和UDDI等。Web Services具有完全的平台无关性、语言无关性,其主要目标就是要在现