MELP甚低码率声码器的研究及实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:fei000chong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动通信技术的发展,用户数量的增多,无线通信中的频带资源变得越来越宝贵。降低语音的编码速率可以提高频带资源的利用率,因此高质量、低速率的语音编码技术被广泛应用于各种无线通信系统。混合激励线性预测(Mixed Excitation Linear Prediction,MELP)编码在线性预测模型的基础上采用了混合激励等五大机制来提高合成语音的质量,能在低于2.4kbps的速率上重建出较高质量的合成语音,可应用于卫星通信、军事通信和水下通信等频带资源极其宝贵的领域。因此基于MELP编码模型的甚低速率声码器是语音编码领域的一个重点研究方向。作为一种高质量的数据压缩算法,矢量量化在甚低速率语音编码领域起着非常重要的作用。本文通过对矢量量化算法进行研究,在预测分裂矢量量化算法中引入分类矢量量化,提出了一种基于高斯混合模型的预测分类分裂矢量量化(GMM-based Predictive Switched Split Vector Quantization,GMM-PSSVQ)算法。用GMM-PSSVQ算法对2.4kbps MELP声码器中的线谱频率(Line Spectrum Frequency,LSF)参数进行量化,并与多级矢量量化算法和预测分裂矢量量化算法进行对比,实验结果表明使用GMM-PSSVQ算法的声码器合成的语音的平均谱失真最小,客观感知语音质量评估(Perceptual Evaluation of Speech Quality,PESQ)值最高,证明该算法能有效地降低LSF参数的量化失真,进而提高合成语音的质量。本文在深入研究标准MELP声码器算法原理的基础上,通过采用多帧联合量化和线性插值等技术降低编码速率,设计出了一种基于MELP的甚低速率声码器,编码速率为600bps。该声码器以20ms为一子帧,5个子帧组成一个超帧,根据子帧的清/浊音判决结果,将超帧划分为16种模式,对每种模式下的语音特征参数用60bit进行联合量化。在语音特征参数比特分配方案中,编码端采用GMM-PSSVQ算法只对一个超帧中2~3个子帧的LSF参数进行量化;解码端解码出这几帧的LSF参数后,利用相邻子帧之间的相关性,采用拉格朗日插值法计算出该超帧其它子帧的LSF参数。通过PESQ和判断韵字测试(Diagnostic Rhymer Test,DRT)对本文设计的声码器进行了性能测试,结果表明本文设计的600bps MELP声码器合成的语音具有较高的清晰度和可懂度。
其他文献
由于飞行器动态模型航迹生成算法与惯性导航系统算法原理存在差异,无法直接仿真分析惯性传感器不同误差特性对惯性导航系统动态性能的影响。基于飞行器动态模型航迹数据,提出
成功的广告翻译无疑能给消费者美好的联想并激发消费者的购买欲望。在经济全球化的今天,跨文化的广告翻译对经济社会的作用不言而喻。广告翻译的使命已不再是单纯的语言转化,
<正>民间工艺是劳动人民创造的生活化的艺术,它与劳动人民的生产、生活、风俗习惯有着密切的联系,它以满足劳动人民的精神和物质文化需求为创作宗旨,它是中华民族文化的重要
<正>一、故事回放在使用《幼儿园活动整合课程》前,我园一直采用分科教学模式。在使用整合课程后,我园教师的观念和行为经受了很大的挑战,也发生了一系列变化。下面这几个片
试验以猪皮为原料 ,采用酶法、碱法对猪皮进行处理 ,比较两种方法的处理效果及经济效益 ,重点研究了碱处理方法对猪皮的保水性、膨胀度及透明度等方面的影响 ,研究了试剂浓度
如何借综合国力增强之势,抓住中国进入“国际时尚主战场”的重大战略机遇,搭乘国家形象提升顺风车,加大提升职业服饰这一代表国家现代工业文明风貌的时尚魅力?中国职业装行业
介绍了深孔爆破制裂-压力灌降阻剂法在降低垂直接地体的接地电阻中的应用情况。试验结果表明,该法具有明显的降阻效果。深孔爆破制裂时的制裂半径与制裂区域的土壤电阻率有关,如
  本文主要介绍在城市智能交通、轨道交通等领域中工业以太网的应用。其中重点介绍工业以太网交换机的产品特点和优势;并介绍各个系统的网络需求,以及工业以太网如何工作。
Web集群的节能问题是急需解决的重要问题,为此提出了一种Web集群节能部署方案。该方案同时采用动态调整CPU频率和动态开关服务节点的措施来进行节能,运用M/G/1 PS排队模型对服务
计算机信息网络技术的应用与发展,使医院电子信息档案管理面临的风险更加复杂、严峻。因此,及时把握电子档案信息的特点、分析电子档案信息风险类型及风险特点,坚持医院电子