论文部分内容阅读
本文提出了一种基于空间定位的混叠语音的分离方法。根据鸡尾酒会效应,人耳能够在嘈杂的环境中将自己感兴趣的语音提取出来。基于人耳这样的特性,我们提出了这样一种方法:将混合后的语音流通过频率分解和时间帧分解成一个个小的片段。然后求取每个小片段上的ITD(到达双耳时间上的差异性)和IID(到达双耳强度上的差异性)值,经过实验证明某个片段上的ITD值和IID值与该片段上的信噪能量比是单调递增关系,因此通过和域值的比较,得出掩蔽系数,来判断每个小片段具体是属于哪个声源。最后将属于同一声源的小片段组合起来,就可以得到分离后的语音。实验结果表明,本文提出的基于空间定位的混叠语音的分离方法是有效的。