基于时频稀疏性的欠定盲源语音信号分离技术研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:sunnywwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,盲声源分离技术随着科技的发展也日趋成熟。如果观测信号的数目大于或等于源信号的数目,将其定义为超定或正定盲声源分离。否则将其定义为欠定盲声源分离。与此同时,根据源信号的混合方式又可分为线性、卷积以及非线性盲声源分离。本论文中主要针对线性欠定盲声源分离问题进行研究,主要的工作如下:1、对语音信号处理的基础理论知识进行了阐述,并介绍了欠定盲声源分离中利用语音信号的时频稀疏性的解决方法“两步法”—混合矩阵的估计和源信号的重建。分别对混合矩阵估计算法和源信号重建算法进行了详细的介绍,并分析各个算法的优缺点。此外还介绍了估计混合矩阵和重建源信号同时进行的ICA算法。2、针对混合矩阵的估计精度问题,研究了语音信号的稀疏性增强处理问题。通过将现有的筛选单源时频点的算法进行研究,提出了一种新的高效筛选单源时频点的算法,并通过仿真证明了其筛选单源时频点的高效准确性。3、利用筛选出来的单源时频点,估计出混合矩阵,仿真证明了混合矩阵精度有所提高。在重建源信号这一步中,针对最短路径法的重建速度慢、精度低这一问题,提出了将最短路径法和二值时频掩蔽技术结合起来的算法,最后通过仿真证明了新的算法重建源信号的速度、精度都有所提高。4、针对主要解决超定或正定的盲声源分离问题的ICA算法进行研究,提出了一种将ICA算法与二值掩蔽技术结合起来的算法,充分利用语音信号的时频稀疏性,将ICA算法应用到欠定盲声源分离中,并结合倒谱平滑减少了分离信号中的音乐噪声。最后通过仿真实现了线性混合信号的欠定分离,并证明了其分离效果优于DUET算法的分离效果。
其他文献
三维重建技术作为计算机视觉领域的一个重要研究方向,已在社会生产、生活的各个方面显示出越来越不可忽视的地位,具有广泛的应用价值。从明暗恢复形状(SFS)的方法,由于只需单
本文是基于MPEG-2标准的视频压缩编码系统的实现与应用。MPEG-2标准于1994年由ITU-T的视频编码专家组(Video Coding ExpertsGroup,VCEG)和ISO/IEC的活动图像编码专家组(Movin
混合ARQ技术(HARQ)结合了前向纠错(FEC)和反馈重发(ARO)两者的优点,充分利用了重传和纠错机制,可以提供很高的可靠性。协作网由于有转接节点的中继,整个网络性能得到了增强。
近年来,移动互联网的强势崛起促使着无线通信技术的快速发展。WiFi技术以其高带宽、低资费的优势逐渐成为了移动接入的第一入口。然而,传统的WLAN网络中WiFi热点必须通过有线
多传感器数据融合技术是国家重点研究项目,已列为未来十大新兴技术之首,举足轻重,目前已经发展应用到诸多领域,如医疗、工业、农业等。多传感器数据融合技术是通过综合来自不
近年来,由于国际形势的变化,恐怖活动日渐猖獗,为减少恐怖事件的发生,各国纷纷大力提升安全防范设备的技术水平,安全检查中对炸药的检测尤为重要。核四极矩共振技术由于找到
本文首先研究了无线通信信道特性,然后阐述了高速铁路无线信道的特点。针对高速无线环境中的多普勒频移和多径效应问题,本文重点研究了MLSE均衡器,这是因为相对于线性均衡(LE
地面国家数字电视广播标准(DTMB,也称为DMB-TH),它融合了清华提出的基于多载波DMB-T方案和上海交大提出的基于单载波ADTB-T方案。单频网(Single Frequency Network,SFN)组网
蓝牙技术是一种短距离、低功耗的无线传输技术,主要用于解决便携式设备的近距离无线互联,具有功耗小、成本低等优点,因此在日常生产和生活中得到了广泛的应用。蓝牙SIG发布了
计算机和网络的普及使得人们之间的交往越来越频繁、越来越方便,但随之而来的安全问题却越来越突出。传统的身份鉴别方法(如钥匙、口令等)已不能满足社会的需要,基于生物特征