低比特率语音信号编码技术研究

来源 :长春工业大学 | 被引量 : 0次 | 上传用户:guw2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人们日常交流的重要手段,同时也是最主要的信息载体之一。无论从语音存储还是传输的角度看,语音编码压缩都具有重要意义。由于新一代数字多媒体通信技术的发展和多样化的商业应用需求,开发高质量、低速率、低时延的语音编码器成为了当前研究的又一热点。编码技术被广泛的运用到语音信号的数字化传输中来,这也是通信发展的主要方向之一。语音的数字通信与模拟通信相比,无疑具有更好的效率和性能,这就体现在:具有更好的话语质量;具有更强的抗干扰性,同时易于加密;最主要的是可以节省带宽,能够更有效地利用网络资源。最简单的数字化的方法是直接进行模/数(A/D)转换,只要满足一定的采样率和量化的要求,就能得到高质量的语音。但是这时语音信号的数据量非常大,因此在进行传输和存储之前,往往要对其进行压缩处理,以减少传输码率或存储量,即进行压缩编码。在语音编码理论中,使被编成数字化的语音信号,所组成的结构化信息量最小化,这是语音编码技术所追求的目标。 为了进一步的降低编码速率、减少算法时延和提高语音质量,我们以MBE(Multi-Band Excitation)算法为核心,从语音分析、参数编/解码和语音合成三方面对算法做了细致的研究和大量的试验,用MATLAB仿真得到了1.8kb/s的MBE-LPC语音编码算法。在此基础上,又以DSK为硬件开发平台,从实际应用的角度,用C语言实现了算法。 经过语音分析,得到了四种待传输的参数:基音周期、清浊音判决信息、能量系数和LPC系数。如果能够合理地对参数进行编码,就可以在该模型下得到最低的传输速率。因为每帧信号为25毫秒,故该方案的比特率是1.8kb/s。 对参数进行解码后,就可以进行语音合成。语音合成分为两部分:清音段的合成与浊音段的合成。在实时实现算法的软件设计中,先对算法进行了高级语言的实现。其目的在于:(1)可以为最终的DSP程序提供基本的程序框架;(2)用定点DSP实现算法,必然会有精度的损失,高级语言的仿真可以为DSP程序提供对照,便于以后对算法性能进行测试。在本课题中,采用了C语言进行这一步的仿真。编程中,在保持原算法描述的基础上,尽量提高算法精度,简化算法复杂度。 当C程序在DSK板上运行时,对每一帧的处理时间为7.5816s,显然计算时延过长,不能满足实时处理的需要。因此,对涉及信号处理的函数采用全汇编手工优化代码,以充分利用DSP芯片所提供的各种资源、增加代码执行的并行性,在保证算法精度的基础上,最大程度的减小计算时延。采用汇编语言优化后,每帧信号的处理时间平均只需要18毫秒,完全可以满足实时应用的要求,并且还有余地加入回声消除等算法。
其他文献
近年来多媒体的发展和智能移动设备的普及更是使得数字图像、数字视频无处不在,相应的数字处理技术也有了很大的进步。人们的生活越来越离不开数字化的媒体,同时对数字化的媒体
随着Internet技术的发展,网络用户数目日益庞大,实时业务与日俱增。这些业务与传统的IP业务不同,除了对单纯的信息传递有要求外,对时延、带宽等也有明确的要求。与此同时,由于移动
本课题的重点为UWB系统在其信道模型下接收机几个关键技术的研究。和传统的无线通信系统相比,UWB系统有其自身的特点,主要体现在两个方面:其一,UWB系统使用极宽的带宽而带来
学位
期刊
近几年来,随着电网规模的扩大和电网控制技术的现代化,电力生产对电力通信的可靠性和带宽提出了越来越高的要求;随着光传输网的组网技术和光网络规模的飞速发展,电力通信光网络的
多视点视频是由摄像机阵列在同一时刻从不同角度对同一场景进行拍摄得到的一组视频序列。它包含丰富的3D信息,具有立体感和交互性,能够提供给观众不同角度的场景信息使观众有身
期刊
无线传感器网络(WSN)是由大量低成本且具有传感、数据处理和无线通信能力的传感器节点自组织构成的多跳网络。由于无线传感器网络不受有线网络约束,组网快捷,具有广阔的应用空
期刊