基于最佳维纳解的双通道话者状态识别方法

来源 :中国声学学会2006年全国声学学术会议 | 被引量 : 0次 | 上传用户:heroic008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
理想的语音分离算法能够将从多话者语音环境中有效地分离出目标话者的语音信号.语音分离算法本身有助于减小其它信号对目标语音的干扰,提高语音的质量,因此,多年来备受学者的关注.双通道混合语音分离模型是语音分离算法的研究基础[1]. 双通道语音混合和分离模型如[2]图2和图4所示,对应的双通道语音分离方法即要根据观察信号x1和x2估计出传递函数(H)A和(H)B以分别逼近实际混合声场HA和HB,进而得到分离信号.系统对HA和HB的估计是在s1和s2的静音段通过自适应滤波器完成的,然而s1和s2未知,仅能通过对x1和x2的分析来完成静音段的检测[2].[3]基于关联(Coherence)法提出了一种有效的检测方法,但是该方法对信号的噪声较为敏感,妨碍了系统的实际应用.本文在最佳维纳解的基础之上,根据因果系统的特性,提出一种新的检测静音段的方法.
其他文献
弯曲振动薄板辐射器因在强功率超声中广泛应用引起了人们的关注.辐射阻抗是声学振动系统一个重要的物理量,可用来评价系统辐射声功率的大小.文献[1,2]分别计算了简支和固定边界条件下弯曲振动矩形和圆形薄板辐射阻抗,本文研究自由边界弯曲振动圆形薄板的辐射阻抗.薄圆板弯曲振动时,若同活塞一样,将辐射阻抗定义为作用在辐射面上的力除以振速,辐射阻抗无法确定.
无损检测是机械工业的重要支柱之一,而管道结构又在工业与日常生活中无处不在,因此如何快速准确地对管道进行无损检测是一个十分值得研究的问题.由于兰姆波的特性,使其在管道检测中具有独特的优势[1].我们已经开展了板状物体缺陷的兰姆波层析成像检测研究[2].本文将研究管状物体与板状物体的关系、管状结构中兰姆波获取走时数据的特殊性以及由之产生的对于重建图像质量的影响因素的分析.
金刚石薄膜的热学性质的准确测量一直是物理学领域中的研究热点之一.由于传统的接触式测量方法受到材料几何尺寸的限制并不适用,而光学方法具有快速、非接触式等特性,近二十年来已先后有多种光学方法应用到薄膜材料的热学参量的表征,其中较为突出的是利用激光在薄膜表面激发瞬态热栅的技术.本文在此基础上,提出了利用多点源光热法表征金刚石薄膜的热学性质,建立了相应的数学模型并测量了硅基底上沉积的金刚石薄膜的热扩散系数
精密直线进给系统在工业应用中变得越来越广泛[1].直线型超声电机与传统的直线电机相比,具有结构相对简单,响应快,推力大,精度高,电磁干扰小,直接驱动负载,断电自锁,没有回程间隙等特点,且可以应用于清洁、低温、真空的环境中,因而有良好的应用前景.典型的直线型超声电机有行波型、复合模态及多模态型、双换能器振子型、声表面波型、层合板型等类型[2、3],其中许多电机采用了两种不同类型的模态作为工作模态,由
时间分辨光声量热技术(PAC)是研究光致解离的动力学信息的十分有效的实验方法.本文利用时间分辨光声量热法测量了激光诱导哺乳动物(人、牛、猪、马和兔)的氧合血红蛋白(HbO2)光解反应的焓变和结构体积变化.血红蛋白(Hb)是由两条α链和两条β链组成的四聚体,可以结合四个氧分子,在血液中起着运送氧分子的功能.Ghelickhani等利用光吸收方法进行过研究,说明HbO2光解反应在100 ps-350μ
近来,光声光谱作为一门新兴的技术已被广泛地应用于各门学科的研究之中.光声光谱可以得到任何类型固态物质(晶体、粉末或凝胶)的吸收光谱,对于许多吸收光谱难以测定的样品,如不透明、高反射、高散射试样,常常无需制样或稍加制样就可以简便地加以测定.另外光声技术还可以直接测定样品的能隙以及无辐射跃迁的弛豫过程.本文合成了Nd(Bta)3L2,Eu(Bta)3L2和Td(Bta)3L2(Bta:苯甲酰三氟丙酮,
从1989年首次提出扭纵复合型驻波超声电机[1]以来,(如图1)该电机显示出了径向尺寸小,输出力矩大,可控性强等优点,引起了人们的普遍关注和广泛研究.但由于发展历史较短,扭振元件制作工艺复杂,目前论述这种电机的运行机理及性能的文章较少.在考虑到粘弹性摩擦材料的模型中,绝大部分都假设定转子对称接触,转子转速恒定,无纵振动[1,2],但并未证实其假设的合理性.本文在时域驱动模型[3]的启发下,针对其未
声压灵敏度频响特性是光纤水听器的重要参数.因此,灵敏度频响的实验室测试,对于鉴定和评价光纤水听器的质量十分重要.传统的测量方法每次只能测量一个频点的灵敏度,想要得到频响曲线需要多次测量,这会带来较大的随机误差,从而影响测量结果的准确性.针对传统方法的不足,本文利用线性扫频信号进行测量.由于线性扫频信号具有频率随时间线性变化的特点,一次测量就能得到频响特性.实验变得快速简便,而且实验结果更准确可靠.
语音和非语音分类的问题属于音频场景分类研究的范畴.国内外对音频场景分类进行了广泛深入的研究,针对不同的音频类型,采用了不同的音频特征[1][2][3].姜洪臣等人[4]综合了前人的工作,采用过零率、短时能量和MFCC等16种音频特征,使用SVM分类器把非静音的音频信号分成语音和非语音,然后又把语音划分为纯语音和非纯语音,把非语音又细分为音乐和环境音.本文对语音和非语音分类的音频特征进行了分析.
近年来,可穿戴式计算机(Wearable Computer)逐渐成为国内外研究领域的热点,人机界面的研究,是可穿戴计算机研究中的一个重要分支.除去传统的功能要求外,可穿戴计算机人机界面还应满足以下两点:第一,以人为本,人机交互应让计算机来适应人,而不是人去适应机器;第二,人机界面的输入输出设备,应该尽量做到小巧隐蔽,既便于携带,又不能影响使用者的外观形象[1].语音,作为传统输入方式(键盘、鼠标等