语音压缩感知关键技术研究

来源 :南京邮电大学 | 被引量 : 28次 | 上传用户:gaolch011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类最方便直接的交流方式,在数字化的时代,如何对语音信号建模以获得更少的采样但又不影响语音的质量,是当前语音信号处理领域中的研究热点。压缩感知(Compressed Sensing,CS)是基于信号在某个域的稀疏性建立的线性、非自适应采样的新理论,表明具有稀疏性的压缩感知能获得更好的压缩性能,信号的稀疏性或可压缩性是实现压缩重构的必要条件之一。由于语音信号具有可压缩性,能够采用低于Nyquist采样的速率无失真地采样信号,基于压缩感知进行低速率无失真地采样给语音信号的采样、存储、传输和处理都带来了很大方便。所以CS理论与语音信号处理领域的结合,意味着对传统的基于奈奎斯特均匀采样定律下的语音分析方法的颠覆。用CS理论中的观测来代替传统的Nyquist采样值,将导致信号特征根本性的变化,进而影响整个语音信号处理各种应用的理论和技术体系。将CS应用于语音信号领域,来探求语音信号处理的各种新方法具有很好的现实意义,而研究语音压缩感知中的各种关键技术是其走向实用的基础。本论文的主要工作和创新如下:(1)根据语音信号在离散余弦(DCT)基下的稀疏性描述了基于正交基的语音压缩感知的框架。基于此框架,对随机观测矩阵进行选择,并采用基追踪(BP)和正交匹配追踪(OMP)算法对已压缩采样的语音信号进行重构,提出一系列结论:CS观测矩阵的维数(其决定了压缩比)、每帧语音信号选取的帧长的大小、分帧时采用的窗函数及帧移,都对重构性能有影响。(2)基于语音信号帧内样值间的相关性和冗余域的稀疏性,采用离散余弦转换矩阵及基追踪方法对压缩感知采样语音进行重构时,针对语音稀疏性不够好导致大压缩下采样后重构效果差的缺点,本文提出采用过完备线性预测字典做转换矩阵,用基追踪重构算法对压缩感知采样语音进行高质量重构。该方法预先由训练语音的预测系数聚类构造过完备字典,不需要测试语音的预测系数;基于过完备线性预测字典重构信号性能良好。对利用基追踪重构的语音进行了主客观评价,得出结论:同样的观测数目下,基于过完备线性预测字典,比基于离散余弦变换矩阵压缩感知采样语音重构信噪比高出3~8dB。(3)针对含白噪语音信号压缩采样后采用基追踪方法重构性能差的问题,在设计更具鲁棒性的重构算法方面提出自适应基追踪去噪方法,该方法根据原含噪信号的信噪比自适应选择重构最佳参数,从而在重构语音的同时提高原信号信噪比。并在此基础上提出自适应基追踪去噪并后置去噪方法。随后又提出前置去噪后基追踪重构方法,针对前置去噪提出了一种基于数据驱动字典和过完备稀疏表示的自适应语音增强方法,含噪语音增强之后再采用基追踪实现含白噪语音的压缩感知。基于这三种方法实现含噪语音信号的压缩感知,并对其性能进行比较。针对观测含有噪声的压缩感知问题,提出采用对观测噪声鲁棒性较好的ABPDN重构算法,当语音观测含有噪声时,采用ABPDN算法重构信号性能优于采用BP算法重构信号性能。(4)针对语音信号在小波域的压缩感知问题,在系数总长度不超过原信号长度的前提下,推导了Sym小波分解合成的矩阵形式,提出了语音信号多尺度压缩感知(MCS)系统框架。论文进一步分析语音信号在小波基下不同级的稀疏性,提出了一种自适应多尺度压缩感知(AMCS)方法,并将这两种方法应用于语音压缩重构中,对重构语音进行了主客观评价和说话人识别验证,得出结论:基于AMCS的压缩重构,比非自适应的MCS重构语音的性能好。
其他文献
随着科学技术的发展,系统规模及复杂性在不断增加,对系统性能的要求在不断提高,同时信息获取的手段也在不断增多,因而面向复杂系统、复杂环境、网络化平台的估计问题成为现代估计
针对几种常见的保险责任调整及其风险模型,探讨了它们之间的相互关系以及保险责任调整对保单风险的影响;通过研究一类特殊的混合分布模型及其性质,给出了考虑保险责任调整的理赔
基于DPSSL(二极管泵浦固体激光器)的窄脉冲激光引信具有发射脉冲窄、峰值功率高、距离分辨力强的优点,是当前国际上激光引信发展的主要方向。本文以超窄脉冲激光引信为应用背
采用稳定性同位素δ15N标识含氮化合物和微生物,通过分子识别技术,分别对封闭系统和动态系统的氮化合物进行研究,以解决氮化合物的定量化及其相互关系问题。结果表明,用δ15N标识
本文从人事档案代管费流向、缴费原则、所有者与使用者、公共服务本义和社会公平等五方面探析原因,并试图架构人事挡案代管的社会化、公益化道路和建设国民信息系统来解决人
本文分析了当前数字美术教学中存在的问题,也阐明了在数字美术教学中将微视频和翻转课堂相结合的主要优势,并从教师和学生的角度出发,设计了微视频支持下的数字美术翻转课堂
<正>纳米银[1,2]由于体积及其微小,表面活性位置多,穿透力强,易于进入多种病原体的内部,从而达到破坏病原体,促进伤口愈合的作用。纳米银对细菌、真菌等都具有较强而持久的抑
对于大部分企业而言,由于存在资金基础较弱等问题,资金链抗风险能力不强;而这"看不见"的链条是企业赖以生存和发展的生命线。本文以我国中小型企业资金链为研究对象,从分析企
目的 分析泮托拉唑钠治疗急性胰腺炎的疗效及其对血清肿瘤坏死因子α(TNF-α)和白介素6(IL-6)的影响。方法 选取2016年1月~2017年10月收治的70例急性胰腺炎患者,按照随机数字表法
Clifford代数是一种深深根植于几何学之中的代数系统。近年来 ,它在微分几何、理论物理、经典分析等方面取得了辉煌的成就 ,是现代理论数学和物理的一个核心工具 ,并在现代科