字典学习算法研究及其在语音增强中的应用

来源 :广东工业大学 | 被引量 : 2次 | 上传用户:a15088899204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
稀疏表示的关键是构造一个有效的字典,使得训练样本(信号)在字典上的表示是稀疏的。常用的方法是解析法,该方法将字典中的原子用预定义的某种数学变换表示,如小波变换(WT)、离散余弦变换(DCT)等。然而,这种方法需要依赖大量的专业知识,同时得到的字典的结构相对简单、形态不够丰富。因此,我们希望可以从大规模的训练样本中自动学习得到与之相适应的字典,使得样本的表示更加稀疏。字典学习正是解决这一问题的工具。字典学习算法能根据已知的训练样本,通过迭代的方式提取出训练样本的特征(原子)。本文将对现有的字典学习算法进行系统的总结分析,提出自己的字典学习算法,并将该算法应用到语音增强的场景中,具体如下。一、字典学习算法的理论及性能差异分析。在这一部分中,本文系统地介绍了现有的字典学习算法,并从更新思路、更新方式和约束项三个角度分析字典更新阶段的差异对算法性能的影响。本文选取恢复已知字典和稀疏逼近AR(1)信号两个实验作为算法的评价指标,通过对实验结果的分析,文章提出了一些改进字典学习算法的参考建议。二、受限一步字典学习(Bounded One-Stage Dictionary Learning,BOS-DL)的算法提出。在这一部分中,本文提出了一种新的字典学习算法。该算法向字典添加了L2范数的约束,解决了单步字典学习(One-Stage Dictionary Learning,OS-DL)算法的过冲问题(overshooting problem)。实验结果表明,新提出的算法较之OS-DL算法具有更好的稳定性。三、BOS-DL算法在语音增强中的应用。在这一部分中,本文提出了基于BOSDL算法的语音增强方法。该方法将BOS-DL算法用于联合幅度谱字典的训练中,克服了基于K-SVD算法的语音增强方法计算量大的问题。文章在TIMIT语音数据库上对新提出的方法进行了对比分析,实验结果表明本文方法所需的时间比基于KSVD算法的语音增强方法少2到3倍,同时增强效果也更好。
其他文献
随着我国高速铁路和高速列车的快速发展,列车通信网络的自主研发与设计在高速铁路的研究中变得越来越重要。作为列车内部控制命令和状态信息的传输通道,列车通信网络正常工作
射频接收机作为无线通信系统中的重要射频模块,其主要作用是对天线接收到的微弱射频信号进行放大、下变频和解调处理以恢复出原始信号。低噪声放大器作为接收机的关键部分,其
对频谱资源的高效利用一直是无线通信技术发展的源动力。随着用户需求的不断增加,移动通信系统在覆盖范围、系统容量、业务动态性等方面的矛盾不断增加,突出表现在频谱资源严重
随着认知无线电技术的日益发展,认知无线电网络的安全问题成为制约其未来发展的重要因素之一。由于认知用户可以感知周围环境并且根据环境配置自身传输参数,因此认知无线电网络
随着互联网IP技术、数字移动通信技术及多媒体业务技术的快速发展,用户对视频的质量及观看体验提出了更高的要求。同时视频本身特点决定了其相对于语音和文字来说包含有更大
机器人利用机器视觉进行物体抓取是机器人应用领域的热门研究之一。目的在于靠机器视觉检测出被抓取物体的可靠抓取位置和方向,进而通过运动规划算法控制机械臂完成抓取动作
随着数码设备的日益普及以及互联网的深入人心,网络上的视频数据呈现出爆炸式增长。而在安全领域,快速增加的摄像头也渐渐的覆盖了城市的每一个角落。这些网站和设备在带来安全
互联网经过四十多年的发展,已经从面向学术的科研网络演变为推动社会经济发展的基础设施,但互联网在移动性、可扩展性、安全性上都逐渐暴露出了问题,由此引发了未来网络研究的热
作为配电网自动化系统的基础,FTU(终端馈线单元)的实现很大程度上取决于选取合适的远动通信协议。远动通信规约种类较多,针对各自特点和实际情况而被应用于不同的现场环境。但是,
海洋占据地球表面积三分之二,它是人类活动的重要领域之一。随着科技的不断发展,现代通信系统和网络已经从空中和陆地延伸到海洋,因此水声通信网络技术在近些年来得到了迅猛的发