600bps语音编码算法研究和实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:leng159461
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,越来越多的高速宽带通信系统被应用于实际中,然而,由于低速率(LBR)和甚低速率(VLBR)语音通信是提供安全和保密语音通信的有效工具,故仍然比较重要,一直备受关注。另外,LBR和VLBR不需要占用太多的信道带宽,因此可以在很多恶劣的环境中应用。基于这些,本文重点研究和实现一种速率为600bps的语音编码算法。混合激励线性预测编码(MELP)将原始语音的编码比特率压缩至2.4Kbit/s,是LBR和VLBR语音通信领域中的一种非常典型和成功的语音编码方案。实际上,很多LBR和VLBR算法都是基于该编码方案实现和发展的。由于MELP算法较好的性能,本文也以其为基础,研究和实现一种600bps的语音编解码算法。本文设计的600bps算法中,语音帧长取为25ms,并将三帧组合成一个超级帧。在编码端,对每一帧信号进行分析并提取出四种参数;在解码端,利用这四种参数进行语音重构。这些参数中,线谱频率(LSF)用于描述声道特性,语音判决用于区分清音帧和浊音帧,基音周期用于给出语音的基本频率,而增益用来计算语音帧的能量。编码时,使用45比特对连续三帧语音所构成的超级帧的四种参数进行统一联合编码,达到降低编码比特率的目的。为了进一步降低编码比特率并提高语音质量,在本文设计的600bps语音编码算法基础上又引入了一种基于语音端点检测(VAD)和舒适噪声产生(CNG)模块的非连续传输(DTX)技术。该技术在编码端使用VAD算法将噪声和语音分开进行处理,由于对噪声帧采用的编码比特数远远少于语音帧,故可以达到降低编码比特率的目的。在解码端,若检测到噪声,则使用CNG算法产生对应的舒适噪声,以保证语音的连贯性。为了实际应用,又将设计的600bps语音编解码算法移植到TI TMS320C6416 DSP上,并对该编解码算法进行优化,使其在DSP-TMS320C6416开发板上能够很好的实时实现。采取的优化方法包括编译器选项优化、内联函数优化、C代码优化等,以此达到降低算法复杂度的目的。测试和评估结果表明,本文设计的600bps语音编解码算法能够获得较高可懂度的自然语音,其主观语音质量评估(PESQ)值为2.158。在高信噪比环境下,增加了非连续传输技术的语音编解码算法能在保证语音可懂度的同时降低编码比特率。在DSP平台上实现的600bps编解码算法的算法复杂度最终降至45兆周期/秒(MCPS)左右。
其他文献
温度是电力系统一个重要的参数,电力系统的一些故障常常导致某些关键部位温度的异常升高,温度过高又会使系统各组成部分的性能下降,甚至导致电力系统设备的损坏,严重影响电力
飞行器再入过程中受到空气强大的挤压,与空气发生剧烈的摩擦,从而在其表面形成很强的激波压缩,导致表面的流场内部产生湍流及震荡。覆盖在飞行器表面的等离子鞘套会呈现出复
无源光网络(Passive Optical Network,PON)技术是打破“最后一公里”瓶颈的核心技术,但它的安全性问题一直没有一个很好的解决方案。因为在通信过程中,光线路终端始终处于主
I consider location-aided handoff decision in hierarchical cellular networks supporting soft handoff for UMTS/WCDMA, where users with different mobility are ass
中继协作分集技术的思想是通过中继与源节点的协作,以获得分集效果,提升系统性能。不同的中继协作分集模式获得的分集增益不同,提升系统性能也就存在着差异。为了寻求性能较
在基于人脸识别的门禁或登录等系统中,活体检测一直是其软肋。联想公司新近推出基于人脸识别的电脑登陆系统,网上立即有贴宣称,利用照片甚至素描都可以登录系统。因此,没有活体检
在科技快速发展的现今,数字电视代替模拟电视是大势所趋,是事物发展的必然法则,而如今大范围的淘汰模拟电视不是很实际,数字机顶盒则因应而生,它作为一种中间解码器,可以将数字电视
在电力系统中广泛应用的开关柜可以指示线路的工作状态,为有效提高对其监控的效率,并且在不改变现有电力设备的情况下,可以通过视频监控、图像识别的方式低成本高效率实现智能化监控。开关柜实际的工作环境及其状态指示装置状态变化的速率等客观因素要求图像识别系统前端需要采集到高分辨率、高帧率的图像才能便于图像识别。由此引发数据量更大、帧间时间差更短等影响,进而对图像处理识别的速度带来更高的要求。随着半导体技术的