语音信号稀疏表示方法研究

来源 :太原理工大学 | 被引量 : 3次 | 上传用户:xymztttt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是迄今为止最常用的交流方式。近年,语音通信多与其他多媒体通信方式相结合,例如电视电话会议、微信语音聊天等。随着这些应用的流行,人们不仅对语音信息量的需求在逐渐变大,对语音质量的要求也迈上了新的台阶。传输用传统的采样量化得到的数字语音,会占用较多信道资源,并且在存储时也对存储空间有很高需求。因此,在确保语音通信可靠性的情况下,如何有效地进行语音编码,降低传输语音的比特率、减少信号占用信道资源,是通信过程中的重要问题。语音信号的稀疏表示是语音信号处理中降低数码率并减少占用带宽的有效手段。本文对语音信号的稀疏表示进行了研究。其中重点研究了基于冗余字典的稀疏表示。文章首先对稀疏表示理论进行了详细的总结和归纳,对信号稀疏表示的两个关键技术—稀疏分解算法和稀疏基的构造进行深入分析。1.首先对K-SVD字典训练算法进行研究,并将其与K-Means算法及MOD算法展开对比讨论。K-SVD算法的主要特点是可以为特定的信号训练适应该信号的字典,并能在得到字典的同时得到信号的稀疏表示。K-Means算法是K-SVD算法码本维数为1的特殊情况。与MOD算法对比,K-SVD算法将MOD算法中对矩阵的求逆转化为对误差矩阵kE的rank-1逼近。本文从对比分析这三者的差异角度来阐述K-SVD算法用于字典训练的机理。2.本文基于线性稀疏表示,针对K-SVD字典初始化问题进行了研究。基于传统K-SVD训练字典的方法需要在开始就确定字典的规模,而选择的字典规模不当会造成信号过表示或欠表示,严重影响语音的稀疏质量。针对字典初始规模的选择问题,本文提出了一种基于新型BDS模型的字典初始化方法,该方法根据最佳字典规模与稀疏比的关系为字典规模建立模型,可以自适应的为语音信号选择恰当的初始字典,避免了K-SVD方法依靠经验设置字典规模的缺陷。本文将加入BDS模型的训练字典的方法应用于来自太原理工大学数字音频与视频实验室语音库的语音,进行仿真实验并对实验结果进行了分析。实验结果表明:基于BDS模型的语音信号字典构造方法实现了自适应选择最佳字典规模目的,可在保证重构语音质量的同时,进一步提高字典训练的效率。3.本文针对语音信号的非线性特征,提出一种基于核字典的语音信号稀疏表示方法。本文通过将语音信号投影至高维特征空间,再对特征空间的信号进行线性稀疏表示来得到语音信号的非线性稀疏表示。算法中将核理论引入计算过程,来避免高维空间的海量计算。实验结果表明:在稀疏表示非线性信号时,核字典法明显优于K-SVD算法。而且在构造字典方面,核字典法比核MOD算法性能更优。
其他文献
无线传感器网络是大量部署在监测区域内传感器节点通过无线通信方式形成的无线网络。由于传感器节点通过自身所携带的电池供电,能量非常有限,因此使得节点能量有效利用成为无
如何适应现代高密度信号环境,高效的利用有限的硬件资源实时处理高速、高灵敏度和分辨率、大动态范围和多个同时到达信号的宽带数字接收机是现代电子战接收机的焦点所在。软
在现代固体火箭和导弹设计中,包覆层是发动机装药的重要组成部分,其表面产生的凸起、凹坑等缺陷会造成厚度值的偏差。若偏差值超过指标要求,不但会影响到发动机的工作性能,甚
自二十世纪九十年代以来,耳声发射现象作为耳科学中热点话题中的一个,一直被大家深入探讨和研究。耳声发射信号(OAEs)是人耳主动发射的一种声波能量,其产生于内耳,可作为人耳
压缩感知(Compressive Sensing,CS)是一种新颖的抽样理论,在原信号具有可压缩性或者可稀疏化的前提下,通过一个测量矩阵对原信号信息的抽样,达到了采样和压缩的目的,而且不需
近年来随着各种新的无线通信技术和理论被提出,并广泛应用于无线通信设备中,无线通信行业得到了蓬勃的发展。日常生活中很多无线通信设备随处可见,比如手机、蓝牙、WLAN无线
近几年来,随着移动多媒体技术的高速发展,人们对无线视频通信的需求日益增长。无线视频通信中作为传输主体的视频图像信息是经过高度压缩编码的数据流,数据比特之间的相关性非常
学位
极化域被认为是独立于时间、空间、频率的一种资源域。利用极化域对信号进行分集不仅丰富了分集的种类(时间分集、空间分集、频率分集),更重要的是提升了系统对通信资源的利用
近年来,无线合作通信技术以其能提高无线通信系统的数据吞吐量,服务质量,覆盖范围,谱效率和功率效率等优势,得到了广泛的关注。合作不仅表现在通信技术层面,也表现在通信网络中通信