传声器阵列远场语音增强若干方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wudizeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,远距离拾音技术在智能家居、安防、机械控制等领域的需求日益增长。伴随着拾音距离的增加,声音中混入的噪声和干扰成分也随之增多,多径传输带来的混响、衰落等因素也都会造成目标信号的失真。传统单通道语音增强方法只利用了时-频域信息,因此在面对时频交叠性强、空间区分大的多声源情况时,表现并不尽如人意,而基于传声器阵列的语音增强是提升该场景下目标语音质量的一个重要技术手段。  除了时-频域处理,阵列还具备空间滤波能力,因此为抑制目标方向之外的干扰和噪声提供了另一维度的可能,比起单通道方法而言具有更大的优势。阵列语音增强方法还面临许多值得深入研究解决的难题。拾音距离变远的同时,伴随着环境干扰和噪声的增加,信噪比随之减小,带来处理上的困难。如何高质量地从采样声音数据中提取出感兴趣方向的目标语音,同时又能兼顾运算效率以满足实时处理需要,仍然是当前远讲语音增强领域需要不断探索的课题。  本文主要研究了远讲阵列语音增强方法中的波束形成算法,以及多通道后滤波算法。对针对较大规模阵元数量,研究了基于稀疏约束快速迭代波束形成方法,主要研究工作和创新点包括:  1.在总结了常用的阵列波束形成方法的基础上,提出了一种波束比因子语音增强方法,该方法利用了DAS波束形成器和MVDR波束形成器的空间波束能量差异,将其应用到阵列协方差矩阵对角加载方法中,改进了MVDR波束形成算法,提出的方法在维持了低复杂度的前提下,取得了更高的信干噪比及更优的语音质量。  2.在总结了经典的多通道后滤波算法的前提下,提出了一种较以往的Zelinski和McCowan后滤波算法更为合理的噪声估计方法,应用于多通道后滤波中,改进了算法性能。提出了一种利用空间多波束能量方程组来估计目标声源能量的方法,该方法较以往方法而言是一种新的思路,通过对比也展现了良好的后滤波性能。  3.为增大拾音距离,研究了阵元数较多情况下的波束形成方法,传统方法由于滤波能力或者复杂度等原因难以胜任该情形。根据所提出的方法,采用稀疏约束方法,不仅可以节省运算量,还可以取得更快的收敛速度、更鲁棒的算法性能。
其他文献
目的:  目前,商用眼部药物90%都是滴眼剂,此剂型以其研发简单,成本低廉以及依从性好等优点而广受青睐,但这种类型滴眼剂生物利用度不高,在眼表的滞留时间很短,通常只有少于5%的药物
研究背景:随着发病率的迅速提高,糖尿病已成为当今社会危害人类健康的最主要疾病之一,而胰岛β细胞的数目减少是导致糖尿病发病的主要原因。因此,抑制胰岛β细胞的损伤凋亡并
网络存储系统被广泛应用在数据中心的构建中,为在云计算、大数据平台上部署丰富的应用提供便利的基础条件。而随着互联网隐私日益受到重视,用户要求网络存储的数据是加密保护的
玉米是工农业生产中重要的作物之一,土壤中有效磷不足限制了玉米的高产、优质。然而,在通过大量施用磷肥提高土壤中的有效磷含量以增加产量的同时,却带来了磷矿资源的浪费以及环境污染问题。目前,科学的方法是从基因表达及调控的角度探索玉米的耐低磷机制,发掘耐低磷关键基因,并通过对玉米品种的分子改良,提高玉米对土壤磷的利用效率,同时实现低投入稳产出。本文以耐低磷基因型玉米品种(DSY-2)和低磷敏感基因型玉米品
桥梁信息是一种重要的基础地理信息,同时也是三维数字城市、虚拟地球最基础的空间数据。影像中提取桥梁是目前的一个重要研究热点,具有很强的实用意义。在影像中桥梁与建筑物等
PBDEs由于其阻燃性能,广泛用于塑料,纺织,电子工业,建筑材料等。作为添加剂,PBDEs因为与聚合物的结合不牢固,容易从添加到的聚合物中逃逸出来。所以说在聚合物的生产使用和回收环节
无线网络的发展趋势是多种无线接入技术共存,共同为用户提供服务。这些无线接入技术在覆盖范围、系统容量、及移动性等方面都有自己的优势,将他们进行互补融合成的异构网络,
为了更好地应对快速增长的移动数据业务需求,3GPP在其第四代移动通信标准化工作LTE-A(Long Term Evolution-Advanced)中,提出了异构形式的网络部署架构,在现有的蜂窝移动网络覆
随着汽车工业和公路的快速发展,汽车在带给人们方便的同时也导致了大量的交通事故,给生命财产和国民经济造成了巨大的损失。因此,汽车安全辅助驾驶系统受到越来越多的关注。  
语音编码技术在通信系统中占有重要比例,随着社会的进步,对语音编码技术的要求越来越高,所以需要合成语音质量更好编码速率更低的语音编码器。然而语音质量和编码速率是相互