论文部分内容阅读
稀疏表示的关键是构造一个有效的字典,使得训练样本(信号)在字典上的表示是稀疏的。常用的方法是解析法,该方法将字典中的原子用预定义的某种数学变换表示,如小波变换(WT)、离散余弦变换(DCT)等。然而,这种方法需要依赖大量的专业知识,同时得到的字典的结构相对简单、形态不够丰富。因此,我们希望可以从大规模的训练样本中自动学习得到与之相适应的字典,使得样本的表示更加稀疏。字典学习正是解决这一问题的工具。字典学习算法能根据已知的训练样本,通过迭代的方式提取出训练样本的特征(原子)。本文将对现有的字典学习算法进行系统的总结分析,提出自己的字典学习算法,并将该算法应用到语音增强的场景中,具体如下。一、字典学习算法的理论及性能差异分析。在这一部分中,本文系统地介绍了现有的字典学习算法,并从更新思路、更新方式和约束项三个角度分析字典更新阶段的差异对算法性能的影响。本文选取恢复已知字典和稀疏逼近AR(1)信号两个实验作为算法的评价指标,通过对实验结果的分析,文章提出了一些改进字典学习算法的参考建议。二、受限一步字典学习(Bounded One-Stage Dictionary Learning,BOS-DL)的算法提出。在这一部分中,本文提出了一种新的字典学习算法。该算法向字典添加了L2范数的约束,解决了单步字典学习(One-Stage Dictionary Learning,OS-DL)算法的过冲问题(overshooting problem)。实验结果表明,新提出的算法较之OS-DL算法具有更好的稳定性。三、BOS-DL算法在语音增强中的应用。在这一部分中,本文提出了基于BOSDL算法的语音增强方法。该方法将BOS-DL算法用于联合幅度谱字典的训练中,克服了基于K-SVD算法的语音增强方法计算量大的问题。文章在TIMIT语音数据库上对新提出的方法进行了对比分析,实验结果表明本文方法所需的时间比基于KSVD算法的语音增强方法少2到3倍,同时增强效果也更好。