面向欠定混合与动态信源个数的语音盲解卷研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:weiziqing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实环境中,麦克风接收到的语音信号通常是纯净语音与其他干扰信号的卷积混合。有些情况下,人们对这些源信号及传输通道知之甚少,所以利用盲源分离(Blind Source Separation, BSS)方法,从麦克风观测信号(混合信号)中估计出纯净信号,即进行语音盲解卷,已成为语音信号处理的重要课题。在语音盲解卷中,存在两种较为困难的情况。一是欠定混合情况,混合语音信号的数目少于源信号的数目。此时,一些传统方法已经无法实现分离。有学者利用信号的稀疏性提出时频掩蔽(masking)的分离算法,但若信号的稀疏性不够强,该算法无法得到令人满意的分离效果。再就是,现有的盲解卷算法大都是针对源信号个数已知且在分离过程中恒定的情况。然而,在实际混合过程中,源信号个数可能是时变的。这时,传统方法将因模型失配而无能为力。针对以上两大问题,本文主要做了以下三方面的工作:(1)研究了欠定卷积混合情况下,基于感兴趣语音波达方向的时频masking抽取算法,并提出了通过提高采样频率来增强信号稀疏性的方法。应用仿真和实际录制语音信号的抽取实验结果表明,该方法能增强信号稀疏性,进而提高语音的抽取性能。本文还通过大量仿真实验研究了源信号之间夹角及其波达方向对抽取结果的影响;(2)在将时频masking分离算法应用到欠定卷积混合语音的分离之中时,为了消除盲源分离频域算法普遍存在的顺序模糊性,本文研究了幅度相关性最大及mask聚类调序算法,并将这两种算法结合起来,提出了一种新的改进调序算法。仿真及实际语音分离实验结果表明,改进的调序方法优于幅度相关性最大调序法和mask聚类调序法;(3)针对混合过程中源信号个数时变的情况,研究了消除固定位置上源信号的抵消滤波器算法,根据所建立数据矩阵的特性提出了一种分离矩阵的设计方法。实验结果表明,该方法能够很好地分离信源个数动态变化的混合语音,并且与原算法相比计算更简单,大大节省了运行时间。
其他文献
LTE-Advanced作为LTE(Long Term Evolution,长期演进)的增强技术,是3GPP为了完全满足ITU-R(国际电信联盟无线电通信部门)的IMT-Advanced(高级国际移动通信)需求而提出的。多输入多输
随着科技的飞速发展,对宽带网络的需求日益增加,同时网络规模也不断加大。为了更加完善地管理和维护网络环境,需要对网络性能进行分析,以优化其网络配置,网络流量是影响网络性能的
多波束天线在通信系统中得到了非常广泛的应用,而双频、双极化是其重要的研究方向之一。本文基于传统平面电路工艺加工技术,以C波段无线通信为应用背景,对双频双极化多波束天线
学位
无线传感器网络作为一种新兴的数据采集处理技术,可广泛用于军事、环境、工业等诸多领域。在传感器网络应用中,节点的位置信息起着至关重要的作用,研究高精度、高效率、低能
火灾对于人类的生命财产安全和自然生态环境具有严重的威胁性,通过对火灾进行探测且及时预警对于减少各种损失意义重大。随着智能监控设备的普及,基于视频的火灾探测技术受到
多波束测深技术是当代海底地形勘测的一项高新技术和最主要的海洋调查手段之一,广泛应用于海道测量、海洋工程、海底资源探测与开发等国防和民用领域,被越来越多的海洋国家所
便笺式存储器(Scratch-PadMemory,SPM)由于其低能耗、低延时等优势,已成为能代替高速缓存的片上系统的有效设计方法。并且在SPM上的数据可以通过软件进行精确控制,而Cache是由硬
随着信息技术的快速发展,需要处理的数据信息、也越来越多,因此具有并行计算优势的神经形态系统在信息处理中的作用也越来越大。但是晶体管的尺寸缩小即将到达极限,这使得依赖于电子技术发展的神经形态系统的研究也即将面临技术瓶颈的挑战。在神经形态系统中,一个重要的难题在于电子突触难以满足处理实时的、复杂的情况的要求。忆阻器这一具有天然信息存储能力和纳米级尺寸的类突触元件,非常适合作为电子突触的设计需求,受到许
射频识别技术作为一种新兴的自动化识别技术,具有非接触、高速度通信等方面的优点。射频识别技术的标签结构的成本制约它的应用。无芯片标签结构可大大的降低标签的成本。基于