强噪声环境下基于麦克风阵列的说话人定位方法研究

来源 :兰州理工大学 | 被引量 : 4次 | 上传用户:qq273683019
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于麦克风阵列的说话人定位与跟踪是人机交互的一个重要研究课题,它在机器人、智能会议系统等领域有着广泛的应用。针对基于标准粒子滤波的音频单特征说话人定位精度低,鲁棒性差的问题,本文充分利用音频多特征的互补特性,并且对粒子滤波算法进行改进,提出一种基于音频多特征自适应融合的说话人定位方法,实现强噪声环境下说话人的精确定位。本文的主要工作和创新如下:考虑到标准粒子滤波中采用先验概率密度作为建议分布函数,丢失了量测信息,从而使得定位不准确的问题,采用迭代卡尔曼更新无味粒子滤波产生的均值和方差,形成新的建议分布函数,将最新的音频量测信息融入到建议分布函数当中,增强最新观测信息对系统模型的实时修正作用,提高系统模型的转移精度。并将改进的粒子滤波用在说话人定位中,提出一种基于迭代无味粒子滤波的声源定位方法。仿真结果表明,改进的方法相比于粒子滤波算法和无味粒子滤波算法有更精确的定位效果。针对基于音频单特征的定位容易受到背景噪声的影响,进而定位精度低和鲁棒性差的问题,通过引入特征信息的融合,提出一种基于音频多特征自适应融合的说话人定位方法。该方法首先构建出说话人定位系统模型,通过系统模型定义特征间的差异度函数,并以此评价不同特征对目标定位支持度的一致性。其次,通过分析加性融合和乘性融合的优缺点,以特征间差异度大小为依据,提出一种自适应的特征融合策略,通过比较差异度与限定阈值之间的大小来自适应选取融合策略。最后,在粒子滤波框架下,通过定义的自适应融合方法融合可控波束形成和相位变换加权的可控响应功率两种特征对说话人进行定位跟踪。并在不同运动轨迹下与基于上述单特征的定位结果进行比较,仿真实验表明,融合后的结果更好的利用了不同特征间定位信息的互补性,提高了说话人定位的精度。
其他文献
AFTER EFFECTS(以下简称AE)表达式在影视后期编辑方面有着极其重要的地位,在影视业、影视广告业和视景仿真等方面有着广阔的发展前景,它配合其它影视特效技术在仿真领域能够
光纤陀螺仪作为制导系统和导航方面的关键性部件,是一种极其重要的惯性传感器。慢光光纤陀螺是在传统光纤陀螺的基础上引入慢光,不仅大大减少了光纤所需的长度,而且提高了陀螺仪
霉菌毒素是由真菌产生的一种具有毒性的代谢产物。赭曲霉毒素A(OTA)是存在于谷物、饲料等农产品中的一种霉菌毒素,而伏马毒素B1(FB1)是主要存在于玉米及玉米制品中的一种致癌物。
目的:观察氨基甾体H42648对人慢性粒细胞白血病K562细胞系的抑制增殖和诱导分化作用,并进一步探讨其作用机制。 方法:采用液体培养实验,MTT实验,集落培养实验观察H42648对K562
随着现代通信系统、密码系统、图像处理系统、网络处理器系统等复杂度日益增加,并行处理技术结合Very Large Scale Integration (VLSI)技术已成为各领域共同的发展方向。基于
本文通过对荣华二采区10
期刊
氧是维持人体生命的重要物质,血氧饱和度(SaO2)反映了细胞和组织供养和氧代谢状况,是人体生命特征中的一个重要参数。通过密切监测病人脑血氧饱和度(rScO2)的变化,医护人员可以
针对全球卫星导航系统(GNSS)高精度导航定位易受到对流层延迟误差影响的问题,提出采用全球定位系统(GPS)和北斗卫星导航系统(BDS)组合定位的方法进行动态精密单点定位(PPP):以GPS定位结果为参照,对GPS/BDS组合定位结果进行评估;然后对比分析传统方法(无改正方案)、Saastamoinen模型和天顶对流层延迟(ZTD)参数估计法得到的GPS/BDS组合PPP结果差异。实验结果表明:G
针对形变监测中通过常规方法难以获取完整及时的气体绝缘封闭式组合电器设备状态信息,因而不能准确管控设备,影响变电站安全运行的问题,提出利用我国自主研发的北斗卫星导航系统(BDS)实现气体绝缘封闭式组合电器设备的智能化检测,并设计实现1套超高压变电站气体绝缘封闭式组合电器设备BDS形变监测系统。实验结果表明,该系统可以有效监控和预警设备形变。
随着无线通信的发展,能量消耗已经成为制约无线通信发展的瓶颈。无线携能(Simultaneous Wireless Information and Power Transfer,SWIPT)通信可以在信息传输的同时,利用射频信