论文部分内容阅读
定向拾音是语音增强众多方法中的一种,是按照声音来源方向,在混杂的信号中进行目标信号的拾取,即只拾取特定方向传播来的声音信号,而其他方向的噪声、干扰信号不拾取而衰减或是屏蔽,从而达到目标语音增强的效果。它可以广泛使用在广播电视领域的新闻采访以及普通的DV摄录等场合。目前,定向拾音理论仍存在许多问题有待深入研究,定向拾音算法的性能也需要进一步提高。本文根据声波的传播特性,利用声信号的时间、空间和频率特性,研究并发展了定向拾音技术,并在DSP硬件平台上进行实时实现。具体内容概括如下:
1.研究了利用声压梯度进行定向拾音的问题。以建立一个小尺度、微间距、超指向性传声器阵列的数学模型为目标,采用声压梯度算法,分析并导出了端射阵传声器阵列的指向性函数及指向性因子的表达式,由此导出了一个以二元传声器端射阵为基本单元的一阶声压梯度处理算法的数学模型。
2.研究了通过计算双通道相位差进行定向拾音的问题。以建立一个基于双通道拾音系统的小尺度、微间距、通带平稳、过渡带陡峭的空域滤波器模型为目标,利用空间中声波的声学传播特性,分析并导出两路信号的相位差与衰减系数之间的关系式。通过对阶梯型衰减系数计算公式优缺点的分析,本文给出了高斯函数估计、正切函数估计两种衰减系数的估计公式,在保证通带平稳、过渡带陡峭的性能的同时,能减少阶梯型估计公式带来的语音中断、不连续的现象。同时,本文还提出了一种针对定向拾音系统性能的控制方法,可以让指向性能在不同频率下的表现一致,可以控制过渡带的陡峭性,并且能够精准的控制主瓣宽度以适应不同目的、不同环境的实际使用需求。
3.研究了语音稀疏性假设不成立时对定向拾音的影响,并解决语音非稀疏情况下相位差、衰减系数计算错误的问题。通过对衰减系数进行低通滤波以及基于人耳掩蔽阈值的Bark临界频带衰减两个办法对处理结果进一步处理,以消除音乐噪声、提高语谱图的连续性。
4.研究了不同温度下声音速度的变化给定向拾音带来的影响,并利用分数时延滤波器来解决这个问题。分析对比了加窗法、Farrow结构、拉格朗日插值三个分数时延滤波器设计方法的优缺点。
5.研究了定向拾音技术实现代码的优化问题。以节约算法实现的硬件成本,为其他功能、运算预留更多的计算空间为目的,针对本文提出的定向拾音算法的代码实现进行优化。优化方法分为如下几类:初始化生成参数列表、软件流水、使用内联函数、拆分循环代码、编写线性汇编等。结果表明,优化效果非常明显,运算量大幅度减少。