基于稀疏性的NMF语音信号欠定盲分离方法研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:fuyao698
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
盲源分离(Blind Source Separation,BSS)是表示在先验信息极少,而且原始信号、混叠的类型、信道等不明的状况下,从观测到的信号分离出源信号的过程。盲源分离算法通常用来解决正定或者超定的问题,即观测到的信号和原始信号的数目相同或前者数目较多的情况。但在实际应用中,后者数目较多的欠定情况更为普遍,因此,研究欠定盲信号分离算法具有非常重要的意义和价值。其中,非负矩阵分解(Non-negative Matrix Factorization,NMF)算法最早就是解决欠定盲分离问题的,它不依赖于信号的独立性及非高斯性。语音作为一种盲分离的对象,在计算机听觉、视频会议、信息抗干扰以及生物医学研究等众多领域面前呈现了广阔的发展前景。因此,本文基于在线性混合方式下的语音信号,探究并改进了基于NMF的欠定盲分离算法,核心内容有下列三个部分:(1)对于基于NMF的单通道语音盲分离模型,本文研究了以欧氏(Euclidean,简称Euc)距离或Kullback-Leibler(简称KL)散度为目标函数的基本NMF算法,以及添加傅里叶变换(Short-Time Fourier Transform,STFT)处理的优化NMF算法,本文称作SNMF算法。选取了不同的目标函数进行仿真与比较,和Euc距离下的基本NMF算法及其改进算法相比,KL散度下的NMF算法表现了较好的分离效果。(2)对于语音信号的欠定瞬时混合方式,本文给出了添加约束的KL-SNMF盲分离算法。首先运用此类信号特有的短时平稳性,做了预加重以及分帧加窗等多项处理,然后将得到的幅度谱作为NMF输入矩阵进行数据降维,最后利用负熵为目标函数,以牛顿迭代法为优化算法的快速不动点独立分量分析(Fast fixed point Independent Component Analysis,FastICA)算法来达到分离信号的目的。(3)对于语音信号的欠定卷积混合方式,本文给出了基于EM-KL-SCNMF的盲分离算法。首先将卷积非负矩阵分解(Convolutive Non-negative Matrix Factorization,CNMF)算法运用于盲分离模型,更好地保留了语音的特征信息和帧间的相关性;然后为了充分利用信道间的冗余,摆脱信源统计独立及非高斯分布的约束,使用了期望最大化(Expectation Maximization,EM)算法进行迭代优化,使得目标函数最小化得到估计的信号;最后通过傅里叶逆变换(Inverse STFT,ISTFT)产生分离滤波器,并在其中进行重构信号,得到时域分离信号。本文主要针对以上三个部分展开了研究。将分离出的单个信号和其原始信号比较而言,运用大量的对比仿真实验,证明了本文所提出的算法更好地保持了信号波形,具有较大且平稳的相关系数,较好地实现了信号分离,体现出了有效性和优越性。
其他文献
单脉冲测角技术因其具有精确的角度测量特点,被广泛地应用在探测、制导以及电子对抗等多个场合。针对传统单脉冲方法容易受到外界电磁干扰的影响,并且考虑到自适应波束形成技术
图像目标识别是当前机器视觉和模式识别领域中一个十分重要的研究课题,被广泛应用于众多领域,如医学图像处理、军事自动目标识别、遥感图像分析。近年来基于显著性检测的目标
随着科学技术不断发展和人们对目标跟踪实际需求的不断增加,目标跟踪问题开始受到广泛关注。目标跟踪技术已经广泛应用于军事领域如战场监控、预警、攻击、火力控制等,和民用
物联网是一种对人和物定位、跟踪、识别和监管的智能化网络,“三网融合”理念的提出,推动了物联网技术的快速发展。智能视觉物联网是物联网的视觉感知部分,本文融合通信、计
随着互联网的飞速发展,全球数据量每年以指数增长,使得云计算成为了当前研究与应用的热点。云存储作为云计算的底层服务,是一种架构复杂的分布式文件系统。因为它具有结构灵活、
随着全球导航卫星系统(GNSS)的不断发展和完善,用户对GNSS接收机性能的要求不断提高。为了研究出高性能的软件接收机,需要对接收机的接收算法进行不断的优化。GNSS数字中频信
当对天线进行优化设计时,可以结合电磁仿真软件HFSS和粒子群优化算法予以实现,但是调用HFSS评估粒子群算法的适应度时需要花费大量的时间,同时也对计算机性能有较高的要求,从
视频作为一种信息含量十分丰富的信息载体,已经成为当今信息时代不可缺少的重要组成部分。由于视频序列通常拥有庞大的数据量,如何进行有效地数据压缩一直是人们研究的热点。
形式概念分析是一种对形式背景中的数据进行分析和规则提取的理论,在本体研究、软件工程等众多领域有广泛应用。而随着网络技术快速发展,涌现出越来越多像folksonomy的三维数
语音转换是通过改变与说话人个性特征有关的声学特征参数,使得转换后语音的个性特征与目标说话人更接近。本文重点研究语音转换系统中语音特征参数的有效提取和转换规则,使转换