混合激励线性预测声码器算法的研究

被引量 : 0次 | 上传用户:luxinyiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着宽带通信技术的飞速发展,语音通信的带宽占用在有线通信领域似乎已不再成为问题了,但是在无线通信领域,带宽始终是一种宝贵的资源,尤其在军用和保密通信中,语音编码上取得的成果可以迅速带来抗干扰、保密性能和系统容量的提高。另外在语音存储领域,近年来随着各种便携数码录音装置的流行,对高合成语音质量的语音编码算法也提出了迫切的要求。这些需求正是语音编码的原动力所在。经典的线性预测(LPC)声码器具有很高的编码效率,可以极低的码率(800~2400bps)对语音信号进行编码,不幸的是它的合成语音听起来很不自然,常常夹杂着嗡嗡声,重击声或者音调噪声。混合激励(MELP)声码器是近年来提出的一种以经典LPC声码器为基础的性能优良的语音编码方案,对它的研究方兴未艾,现已取得了不少的成果,可以在1.2kbps的码率下取得MOS分为3.0左右的合成语音,并且具有比较强的抗背景噪声的性能。MELP声码器继承了经典LPC声码器编码效率高的特点,并加入了一些新的特征以模仿人的自然语音。MELP声码器采用混合脉冲和噪声激励解决了经典LPC的嗡嗡声的问题;引入了抖动浊音状态以克服音调噪声;利用参数插值、脉冲散布和自适应谱增强等措施提高合成语音的自然度和可懂度;此外还采用了多带激励,使其具有了比较强的抗背景噪声的性能。本文以美国联邦标准2.4kbps-MELP算法为基础,在MATLAB上建立起了分析MELP算法的软件平台,对其性能进行了分析并提出了一些改进的建议;另外还针对MELP算法的特点对其软硬件实现进行了探讨。本文的第二章介绍了MELP声码器模型的原理,对其特征进行了详细的阐述,重点分析了各个特征的本质及其能够对提高合成语音质量起到的作用。第三章详细介绍了MELP声码器的基本算法,对其中采用的一些先进的技术手段如多级矢量量化(MSVQ)、高分辨率基音检测方法(SRPDA)等进行了重点的讲述。另外还对MELP声码器中使用的一些技术进行了实验分析,检验其效能。第四章利用在MATLAB上搭建的分析平台上对语音信号进行了编解码的试验,分析了MELP声码器的各种特征在语音编码中起到的作用。最后针对MELP声码器的特点,对其软硬件实现提出了建议。
其他文献
本文通过理论分析和数值模拟,对设有减震层的地铁车辆段大平台结构—上部住宅减震系统进行了研究。 本文阐述了这类减震系统与TMD控制系统和基础隔震系统的联系与区别,并根
利用20 L爆炸球研究了充氮条件下甘薯粉-空气混合体系的爆炸特性,充氮后的氧体积分数范围为11.4%~21.0%、甘薯粉实验质量浓度范围为25~1 000g/m3.研究表明,由于充氮后氧浓度降低
场馆类建筑往往具有造型独特、结构复杂以及专业工程多等特点,传统的二维图纸难以表达设计者的思想意图,导致实施人员难以读懂设计图纸、专业工程相互碰撞以及施工现场管理难
深圳市龙岗区宝龙街道2016年12月成立以来,在教育、医疗、交通等民生领域不断发力。而随着“美丽宝龙”计划的实施,宝龙的市容环境大变样,城区形象不断提升。一座文明和谐、
桑树中1-脱氧野尻霉素(1-deoxynojirimycin,DNJ)及其衍生物是一类多羟基生物碱,由于其在化学结构上与-α1,4-葡萄糖类似而显示出降血糖、抗病毒和抗肿瘤转移等多种药理活性。
【正】 今年六月四日,在上音大礼堂举行了一场具有学术性的内部交流独唱音乐会,特邀云南省歌舞团副团长黄虹、湖南省歌舞团主要演员何纪光、贵州省歌舞团副团长阿旺等三位著
期刊
车联网信息作为道路沟通共享信息,具有辅助驾驶的重要意义和前景。它能够提供给驾驶员更多的场景信息,使驾驶风险下降。然而另一方面,车联网信息的出现会导致驾驶员注意力分
教师的专业程度是凭借"实践性知识"来加以保障的,促进教师的专业发展,首先要引导教师反思自身的教育实践,同时,要通过各种形式培养教师的职业道德,促进教育专业知识的成熟,提
近年来,在绿色能源的号召下,光伏电站的建设和应用广泛起来,光伏电站EPC(Engineer Purchase Construct,即设计、采购、施工)总承包项目模式广泛推广起来。但是,在推广的同时
在新课程标准实施过程中,物理新课程注重培养学生科学素养,侧重自主学习、探究学习和协作学习。如何利用信息技术有效地体现新课程标准的理念并促进课程改革,如何让计算机辅助教