基于压缩感知的语音数字编码技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:maomao68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“大数据”(Big Data)时代的到来带来了飞速增长的信息量和信息处理任务。传统的奈奎斯特采样定理提出的最低采样速率在面对超宽带信号或冗余度较高的信号时,不仅在采样端处理任务复杂,而且在后续的存储和压缩时对系统资源造成了浪费。压缩感知技术近年来由于可以实现对信号在采样过程中同时压缩,受到信号处理领域的广泛关注。对于完整的数字语音处理系统而言,采样后的量化编码也是一个重要的环节。然而,目前压缩感知理论还处于研究的起步阶段,对压缩采样后的观测序列处理技术如编码的研究还很少涉及。压缩感知技术作为一种可以代替奈氏采样的信号采样技术,而编码是压缩感知从理论走向实际应用的必要前提。在这样的背景下,本文以压缩感知为基础,研究语音信号压缩感知观测序列的数字编码技术。论文的主要工作和创新点归纳如下:(1)经典的基于奈氏采样语音压缩编码技术中,基于模型的编码得到广泛应用。受到传统语音模型中正弦模型的启发,本文首先对一种利用正弦原子构造的字典和正交匹配追踪算法对语音压缩感知观测序列进行建模,对于每帧观测序列幅度、相位和频率三类参数,根据各类信号序列自身特点采用合适的编码方式进行编码,提高传输的效率。在解码端,利用解码后的参数合成观测序列。之后对其利用基追踪算法重构出合成语音信号,并后置低通滤波器提高合成语音的人耳听觉效果。仿真实验表明:该编码方案在实现对语音信号观测序列压缩编码的同时,主客观重构质量均可以得到保证。(2)利用压缩感知框架下行阶梯矩阵投影后观测序列可保留部分语音特性的特点,采用稀疏表示字典对观测序列进行数学建模的方法,设计了一种新型语音压缩感知编解码器。首先在训练阶段,先利用K奇异值分解方法对大量训练语音通过行阶梯投影后的观测序列进行训练,得到一个语音观测序列码本字典;然后在编码阶段,选取字典内的少量原子对实时语音观测序列建模,编码时仅对少量选择原子的位置和幅度进行编码并传输;解码端利用恢复后的观测序列和压缩感知重构算法恢复语音信号。通过仿真实验表明:基于稀疏表示的语音观测序列编码方案可有效的降低编码传输码率,并且保证良好的重构语音性能。
其他文献
期刊
认知无线电(Cognitive Radio,CR)作为提高频谱利用率、解决频谱资源紧张问题的有效手段已经受到了广泛的关注和研究,它允许认知用户(Cognitive User,CU)利用主用户(Primary U
近年来,随着网络带宽、计算机处理能力和存储容量的迅速提高,以及各种视频信息处理技术的出现,视频监控进入了全球数字化的网络时代。随着微电子、通信以及计算机技术的迅速
随着近年来多媒体技术的飞速发展,许多应用领域对视频图像的实时压缩提出了更高的要求,快速、高效的压缩算法是解决这一问题的关键。运动估计作为实现视频压缩的核心技术,也
学位
如今,数据业务的迅猛发展推动了电信传送网络向着高带宽和多业务的方向发展。光传送网络的引入使得传送网络获得了潜在的无限带宽。在这样一种高速、多业务的光传送网中出现任
近年来,随着人们对安全方面越来越高的需求,视频监控得到了越来越广泛的应用,人们对于数字化视频监测系统的要求也随之提高。但是在恶劣环境下,通过视频监测系统获取图像的质
MIMO技术与OFDM技术作为第四代移动通信系统的关键技术,广泛应用于各种无线通信系统中。然而,其较好的系统性能建立在已知发送端信道状态信息的基础上。有限反馈系统能够为发送
图像语义标注作为图像场景理解的核心之一,已成为图像处理与计算机视觉领域的研究热点。室内场景存在大量语义类别、互相遮挡、低层视觉特征辨识力较弱以及不均匀光照等问题,
随着互联网这个新兴的信息传递媒体的迅猛发展,互联网信息急剧膨胀,如何从海量网络电子文档中及时准确地找到需要的信息己经成为一个函待解决的问题,信息抽取正是在这样的背景下