基于MELP的低码率语音编码技术研究与实现

来源 :北京邮电大学 | 被引量 : 18次 | 上传用户:hillyblue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人们日常交流的主要手段,也是信息的主要载体之一。语音信号存在着很大的冗余度,因此语音压缩在存储和数字化传输方面起到的至关重要的作用。随着通信、计算机网络技术飞速发展,语音编码技术在移动通信、卫星通信、多媒体技术以及IP电话中得到了广泛的应用。但是在很多应用领域,仍然需要更进一步降低编码速率,节省带宽,因此低速语音编码技术迅速发展,其在军事保密通信中具有十分广阔的应用前景。低速语音编码主要采用参数编码方式,多带混合激励线性预测编码(MELP)是参数编码的主流形式之一。1996年3月,美国政府数字语音处理协会选择2.4KbpsMELP语音编码器作为新的联邦标准。本文以此标准算法为基础,从语音参数提取、参数编码及语音合成三个方面深入研究了MELP低速语音编码技术。LPC系数是MELP模型中最重要的参数之一,用线谱对系数LSP作为LPC参数的表现形式,弥补了全极点模型的不足,本文在对线性预测技术深入研究的基础上,对LSP系数的抗噪声性能进行了仿真分析。为了进一步降低编码速率,本文在2.4KbpsMELP标准算法的基础上,采用更为有效的矢量量化方法,构建了1.2KbpsMELP编码算法,并用C代码实现该方案。其中,参数联合量化是1.2KbpsMELP算法的关键。通过对多种码本设计算法的研究与实现,仿真结果表明,采用LBG算法设计出的全搜索矢量量化码本,对联合参数进行矢量量化,能够使编码比特有了明显的降低,同时能够得到比较好的合成语音。
其他文献
语音端点检测是语音分析、语音合成和语音识别中的一个重要环节。在实际运用中,通常要求首先对系统的输入信号进行判断,准确的找出语音信号的起始点和终止点。这样才能采集到真
H.264是ITU-T与ISO/IEC联合开发了新的数字视频压缩标准,也是目前最先进的压缩标准。H.264的应用范围非常广泛,可满足于不同网络环境和应用场合,如标清和高清电视服务、手机
IR-UWB系统以低占空比的超短(纳秒级)冲激脉冲作为载体,无需载波调制。与传统窄带系统相比,UWB具有更低的功率谱密度、更宽的带宽、高数据率和强抗干扰的特性。由于UWB信号经
高光谱解混是高光谱数据理解中的一个重要问题。它旨在将光谱成像仪收集到的混合光谱信号用纯净光谱成分(端元)的叠加来表示,对应的权重就是所求的丰度向量。线性高光谱解混是比较流行的一种解混建模方法,它假设端元之间的相互作用是线性的,这样就使对混合像元建模变得简洁,并且使解决方案不依赖于观测到的物质的物理特征。然而,线性高光谱解混方法也存在一定的问题。首先,由于空间分辨率不足的局限以及混合物质普遍存在的现
多天线系统,也称为多输入多输出(MIMO)系统,可显著提高通信系统的传输容量与链路传输的可靠性,因而,已成为实现未来高速宽带无线接入网的关键技术之一,并且广泛应用于下一代
目标的录取参数精度随着雷达技术的不断发展有了越来越高的要求,同时随着作用范围的增大,录取目标的数据量随之增加,处理时间也随之增加。点迹凝聚是一种利用雷达回波信息提
随着Internet的飞速发展,网络由以前单一的数据网变成了多业务的综合数字网,它的设计有两大目标:一是保证各类业务的QoS要求,二是使网络的资源利用率达到最佳。因此,研究网络分组
血管紧张素转化酶抑制剂(ACEI)及受体拮抗剂(ARB)是临床上常用的治疗糖尿病肾病的药物,长期应用可降低糖尿病患者肾小球损伤、减少蛋白尿[1]。然而越来越多的临床证据发现“
期刊
现代信息技术的迅猛发展和人们生活质量的提高,使得视频处理方面的研究与应用,尤其是实时图像处理受到了广泛关注。近年来,DSP技术的不断发展,将数字信号处理领域的理论研究
期刊