基于粒子滤波方法的说话人跟踪技术研究

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:mathayus0422
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人跟踪技术是物联网、人工智能、智慧城市以及智能家居等研究领域的基础支撑技术之一。传统基于麦克风阵列的声源定位跟踪方法在噪声背景情况下容易出现虚拟峰值,导致估计错误。随着滤波技术的发展,研究人员采用贝叶斯状态空间的方法,利用运动状态模型的时间相关性和虚拟峰值的时间非连续性,很好地克服了这一缺陷。特别是适应非线性、非高斯系统的粒子滤波技术的提出,进一步促进了说话人跟踪技术的发展。  但是,当前的研究多数都是在系统噪声统计特性固定的情况下展开,人为设定系统噪声是相互独立的,且服从高斯特性,方差不变,完全忽略了模型及观测噪声对系统跟踪性能的影响。在实际的说话人跟踪系统中,由于房间混响累计效应的影响,导致观测噪声具有相关性,且统计特性无法预先精确获知,严重影响了跟踪器的精度和鲁棒性。本文以说话人跟踪技术为应用背景,在充分考虑环境混响噪声累积效应、系统模型偏差噪声以及传感器阵列量测噪声影响的情况下,进一步扩展了粒子滤波的基础理论和应用环境,并在粒子滤波框架内对非连续发音、多个说话人重叠发音情况下的说话人跟踪问题展开研究。主要完成了以下四个方面的研究内容:  (1)基于相关检测的自适应粒子滤波方法。针对标准粒子滤波算法的采样密度函数没有融入最新观测信息的缺陷,采用中心差分计算方法对重要性密度函数进行实时更新,产生优化的建议分布函数,较好地融入了最新观测信息对采样函数的实时修正,保证了采样粒子的多样性;考虑到采样粒子数、滤波精度以及算法实时性矛盾的折中,利用说话人状态的观测值和模型估计值之间的相关性,在相关检测的思想建立了采样粒子数自适应更新规则,有效折中了跟踪精度与运行时间之间的矛盾,在仿真实验环境下验证了算法的有效性和优越性。  (2)噪声统计特性未知及相关情况下的粒子滤波理论。以系统噪声方差未知及特性相关情况下的说话人跟踪系统为背景,研究了噪声统计特性相关及未知情况的联合滤波估计方法。首先,在相关噪声模型的基础上构建说话人运动模型,分析求解相关噪声统计特性的分布函数,并给出了噪声联合概率密度函数的有效度量分解形式;接着,以独立分解的概率密度函数为基础推导了噪声统计特性与目标函数的联合估计数值表达式。最后,在考虑噪声统计特性未知及相关的基础上,针对不同混响时间情况下的跟踪精确性和系统抗干扰能力进行了实验分析。  (3)系统噪声统计特性时变情况下的自适应滤波方法。在实际的说话人跟踪环境中,由于多源噪声及房间混响的影响,导致系统观测噪声的统计特性不具有恒定不变性,预先设置的固定噪声方差会降低系统模型拟合的可信度。以噪声统计特性时变情况下的说话人跟踪问题为背景,研究了噪声模型模糊自适应跟踪实现方法。在粒子滤波的框架内采用布朗模型对说话人运动进行建模估计,根据平滑估计值和当前观测信息之间的相关性,对估计误差的均值和方差进行平滑处理;并基于平滑估计的误差特性采用模糊逻辑进行噪声方差的自适应调整,实时保证模型具有较高的拟合度,克服了传统滤波器不能对环境变化进行实时优化的缺陷。  (4)说话人发音断续及语音重叠情况下的跟踪问题。实际的说话人跟踪系统中,经常会出现语音的静默以及多人同时发音的重叠情况。首先,在粒子滤波的框架内,采用随机有限集(Random Finite Set: RFS)的思想进行说话人运动状态建模,将说话人的位置信息和发音状态综合成单个的变量集合,构成系统模型的单一状态变量;接着,将模型噪声进行解相关处理,保证在语音重叠情况下系统模型的相互独立性,为解决多说话人的语音重叠问题提供独立的噪声模型;最后,在提出的解相关噪声粒子滤波框架内应用RFS状态模型进行语音断续及重叠情况下的说话人跟踪处理。计算机仿真和实际场景下说话人跟踪效果验证了方法的有效性。  本论文针对系统噪声未知、时变及相关情况下的说话人跟踪问题展开研究,推导了相关的粒子滤波数值分析理论,并扩展说话人跟踪系统的应用范围,研究表明提高了复杂背景噪声条件下的说话人跟踪精确性和鲁棒性。
其他文献
随着新世纪的到来 ,知识创新和人才开发 ,已成为各国经济发展的基础 ,在成人教育方面如何培养更多的创新人才 ,服务于社会 ,已成为成人教育工作者所关心的问题 ,本文在文章中
随着控制系统规模的日益扩大,网络控制系统的应用越来越广泛。而工业以太网作为一种成功的信息网络技术,正日益显示出其在控制网络中的优势。目前工业界存在着几十种现场总线
科学教育与人文教育脱离乃至相对立,是导致学生人格分裂、素质残缺、高等教育发展滞后的根本原因之一.现实要求我国高等教育必须借鉴世界各国实践科学教育与人文教育的成功经
基于大数据展开应用型院校的教学管理工作,能够使教学管理决策更加科学,完善教学全过程管理的评价效果,提高学生心理管理的时效性.基于此,本文首先针对基于大数据的应用型院
针对煤炭内在灰分嵌布粒度细的特点,开发了一种利用物理方法深度脱灰脱硫的选煤新工艺。介绍了该工艺的试验结果,并论述了该工艺对高质量利用煤炭资源的应用前景。 Aiming at
在经济发展新形势下,市场监管局的任务更加繁重,档案作为其日常管理的主要内容,其对促进单位发展具有重要的参考价值,因此,市场监管局要给予档案工作以高度重视,根据时代需要
信息技术、网络技术的高速发展和后PC时代的到来,嵌入式系统已广泛渗透到了现代社会的各个方面。随着Internet应用的日益普及,Internet成为信息流通的重要渠道。与此同时,嵌入式
随着网络在人们生活与工作的各方面使用的日益普遍,网络安全问题已经成为一个被人们强烈关注的热点.而其中黑客攻击所造成的安全问题是很重要的一个方面.本文将介绍有关黑客
本文从素质教育出发,探讨如何培养大学生创新精神和实践能力,以适应我国企业多层次、多渠道、全方位地参与国际分工和国际竞争对高级人才的需求.
感应加热电源以其环保、节能等优点在工业生产中得到了广泛的应用,逆变控制电路是直接影响感应加热电源能否安全、高效运行的关键因素。目前的感应加热装置很多采用模拟电路控制,而模拟控制电路触点多,焊点多,系统可靠性低,对一些元件的工艺性要求高,电路中控制参数不容易进行修改,灵活性较差。近年来随着微处理机的发展,数字式控制精确,软件设计灵活,因而整个控制系统容易实现,在感应加热领域中运用数字式控制已是一个发