麦克风网络中基于分布式粒子滤波的说话人跟踪方法研究

来源 :大连理工大学 | 被引量 : 9次 | 上传用户:w998998
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用麦克风阵列对室内说话人进行跟踪,是根据分布于空间中的多个麦克风接收的音频信号对运动说话人的位置信息进行估计。基于麦克风阵列的说话人跟踪技术在公共安全监控、音视频会议系统、语音识别、车载电话以及机器人等领域都有广泛应用。近年来,随着无线传感器网络、网络通信、移动计算以及集成电路技术的快速发展,生产小尺寸麦克风的成本越来越低,嵌入式处理器的计算能力显著增强,分布式麦克风网络逐渐发展起来,基于分布式麦克风网络的声源定位和跟踪成为语音处理领域一个新的研究热点。然而,目前大多数声源跟踪算法主要针对传统的规则麦克风阵列,并不能直接用于分布式麦克风网络。贝叶斯滤波是解决室内说话人跟踪问题的典型方法,它采用状态空间的方法对说话人跟踪问题进行建模。当状态空间模型为线性、高斯时,卡尔曼滤波是贝叶斯滤波的最优解;当状态空间模型为非线性、非高斯时,粒子滤波是贝叶斯滤波的有效近似解。在室内噪声和混响条件下,说话人状态的后验分布多为非高斯分布,其观测模型通常为非线性模型。据此,本文在贝叶斯滤波理论框架下,对现有的分布式粒子滤波算法进行改进,提高了滤波器的跟踪精度和鲁棒性;通过深入研究粒子滤波理论,提出了一种新的分布式粒子滤波器。在此基础上,将所提出的分布式粒子滤波算法应用于麦克风网络进行室内说话人跟踪,提出了一些针对性的改进措施。本论文的主要创新工作如下:(1)在现有的基于粒子权重一致性的分布式粒子滤波器中,其似然函数的计算要求各个节点的观测在给定状态的条件下相互独立,且需要已知观测噪声的统计信息。针对该问题,本文利用广域相干场函数在某一空间位置的取值反应了声源在该位置处的可能性大小的特点构建了一种伪似然函数,进而推导了一种广域相干场-分布式粒子滤波器,并将其用于麦克风网络中的说话人跟踪问题。该方法不要求各个节点的观测条件独立,也无需已知观测噪声的统计信息,且易于分布式计算。仿真和实际实验结果表明,所提出的方法在噪声和混响环境中具有良好的跟踪性能。(2)针对非线性高斯系统,提出了一种改进的分布式高斯粒子滤波器,并将其应用于麦克风网络中的说话人跟踪问题。该方法在预测阶段采用粒子的形式对状态的概率密度进行预测,并对各个节点的局部预测信息进行融合,进而使每个节点拥有状态后验概率的全局预测结果;在融合阶段根据一种最优的融合规则对各个节点的局部估计进行融合并去除了局部估计之间的公共先验,最终每个节点都拥有关于状态的全局估计。该方法只要求相邻节点间的局部通信,且允许各个节点的局部估计具有一定的相关性。仿真和实际实验结果表明,所提出的说话人跟踪方法在噪声和混响环境中能够对运动的说话人进行有效地跟踪。(3)针对包含线性、高斯子结构的非线性、非高斯系统,提出了一种分布式边缘辅助粒子滤波器。该算法利用边缘化技术将线性状态分量从状态空间模型中分离出来,并利用分布式卡尔曼滤波器来估计;而剩余的非线性状态分量则采用分布式辅助粒子滤波器来估计。针对说话人状态空间模型包含线性、高斯子结构的特点,将分布式边缘辅助粒子滤波器应用于说话人跟踪问题,通过边缘化技术将说话人的位置信息从状态空间模型中分离出来并采用分布式的辅助粒子滤波器来估计;而其速度信息则采用分布式卡尔曼滤波器来估计。此外,利用互相关函数的幅度信息和能量比,提出了一种时间延迟选择机制来去除不可靠的观测,提高了其跟踪性能。仿真和实际实验结果表明,所提出的方法在噪声和混响环境中具有良好的跟踪效果。
其他文献
1984年3月9日,青田县百货公司扩建仓库挖地基时发现两缸青瓷器和铜器。由于民工将装青瓷的陶缸砸破,多数器物破碎,较为完整的器物被哄抢。县文化、文物管理部门得知这一情况
国外关于可持续发展能力评价基于财务角度的研究 国外对可持续发展能力评价基于财务角度的研究主要是对可持续增长模型的研究.Higgins(1977)在其《财务管理分析》一书中确立
期刊
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
采用脉冲应答技术对模拟厌氧固定床反应器内的液相非理想流态进行了研究.实验的液体流速μ=1.21×10-3~6.81×10-2 m/s,气体流速为0.008~0.034 m/s,该范围相对应的厌氧
利用自制的鼓泡反应器,进行了含氧化亚铁硫杆菌的酸性铁溶液脱除烟气中SO2的实验研究。结果表明,细菌直接脱硫的效果较差:Fe^3+在脱硫实验过程中既有催化作用,又有氧化作用;细菌主
划城岗遗址是长江中游地区一处极为重要的新石器时代遗址,早在1979年,湖南省博物馆就曾作过正式发掘。遗址位于湖南省安乡县安障乡沙湖口村,南距安乡县城约9公里,虎渡河、松
高砂脊又名高家溪,位于望城县高塘岭镇,南距望城县城4公里,为湘江下游西岸、沩水入湘江河口处的一长条形砂洲,总面积约18万平方米。20世纪70年代,当地村民在烧砖取土时曾发
【正】 最近有一条爱乐者为之雀跃的消息:英国广播公司打开了封存多年的一个音乐录音资料库。其中珍奇,不可胜数!将要制成CD以飨听众云。 其实,我们中国的老唱片中也保存了大
舰船摇摆产生的过载对舰载导弹的初始扰动产生重要的影响。同时考虑舰船的横摇、纵摇和垂荡运动,采用极小化极大值设计方法,建立导弹在舰船摇摆运动影响下发射过程中的发射动
多分辨率建模是近年来仿真技术的研究热点之一.将不同分辨率的模型有机地结合起来进行仿真研究,以发挥不同分辨率模型的优势,对提高仿真的真实性、灵活性、可用性和可重用性