基于音频辅助的音视频信息融合目标跟踪方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:wg245940815
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动目标的定位和跟踪是室内智能系统场景分析的一个重要研究方向。传统的定位跟踪方法主要是单独利用单一的音视频的信息对目标进行跟踪,但是视频跟踪和音频跟踪在复杂情景下都有各自的局限性,为了使运动目标的跟踪系统性能较好,本文讨论了一种粒子滤波框架下的音视频信息融合跟踪算法。音频定位部分,主要讨论了基于时延估计(TDOA)的声源定位算法,重点介绍了其中的相位转换(PHAT)加权方式的广义互相关(GCC)方法。为提高定位精度,对PHAT-GCC方法进行了多帧加权平滑等改进,实验证明改进算法在抗噪和抗混响方面有着不错的性能。还介绍了时延估计下的声源方位估计,对声源位置的计算进行了具体推导,并分析了该空间结构的固有误差。视频处理部分,采用均值漂移(Mean Shift)算法来对目标进行定位跟踪,提取目标区域的颜色特征,并对其进行均值偏移处理,迭代寻找到候选模板与目标模板最相似的位置即为目标位置,进而实现跟踪。在遮挡问题中,采用新的模板更新策略对原算法进行改进,实验证明,模板更新策略有效防止了遮挡对目标模板的引入的错误特征,很好解决了遮挡问题。信息融合部分,提出了粒子滤波框架下的基于特征有效性的音视频信息融合方法,利用特征有效性对TDOA特征和颜色特征在观测步骤进行融合,实现了异类信息的互补原则。在粒子滤波中嵌入均值漂移方法,提高跟踪系统实时性。最后利用模板更新策略保证遮挡情形下的目标模板的正确性。实验证明改进后的音视频融合跟踪算法比单一的跟踪算法有更好的性能。
其他文献
互联网的高速发展和网络规模的急剧增加使网络数据流量呈指数形式增长,高性能计算、数据中心、网络直播、AR(增强现实)和未来的VR(虚拟现实)等对网络带宽、交换吞吐量均提出
众所周知,材料自身的均匀性对其使用性能有重要的影响,若沥青路面内部集料分布不均匀,则有可能出现过多的早期病害,直接影响沥青路面的长期使用性能。目前,现有的沥青路面均
随着移动通信技术和定位技术的飞速发展,基于位置服务(Location-based service,LBS)在世界范围内得到了广泛应用,特别是最近几年各种商业的LBS产品不断涌现,丰富了用户的日常
背景:在宏基因组序列分类的问题上,目前已有的宏基因组序列分类软件大多对参考基因组有较高的依赖性。当环境样本中存在大量未收录/注释物种时,使用这些软件分类将产生大量分
近年来,基于位置服务在人们的日常生活中应用的越来越广泛,人们通过手机等智能移动设备可以方便的获得基于位置的服务,但与此同时,基于位置服务所产生的副作用也不容忽视,其
商业银行是我国金融市场中的重要主体。商业银行的公司治理及风险控制均是近年来金融研究的热点。本研究试图通过分析我国商业银行公司治理与其风险承担之间的相关关系,为我
研究目的分析2009-2019年上海市奉贤区手足口病的时间分布、人群分布、地区分布、气象因素相关性、病原构成特征、重症病例的早期临床表现、重症病例的主要危险因素,为城市郊区手足口病预防控制提供流行病学依据。研究方法1.手足口病三间分布特征采用描述性流行病学方法,率的比较采用χ2检验,检验水准为α=0.05,数据整理和统计分析采用Epi Data3.0、excels和SPSS 20.0。疫情资料源自
党的十八大以来,以习近平总书记为核心的党中央将脱贫攻坚作为一项重要政治任务,向全世界作出了庄严承诺,提出2020年要实现全面脱贫摘帽的目标。湖南省是农业大省,全省人口超过7300万,其中3000多万生活在农村。全省的贫困发生率和贫困人口数量在全国位居前列。全省122个县市区中有51个为贫困县,其中11个为深度贫困县。武陵山地区和罗霄山地区还属于全国集中连片特困区。在2020年前实现脱贫摘帽是全省各
在5G网络时代,异构无线网络有非常好的发展和应用场景。在不同的技术接入网中,因为无线局域网和蜂窝网以及5G网络在优缺点上互补,使得这三种网络的融合有非常好的发展场景,同时也提高了无线网络融合的进程。因为不同的无线接入网络在资源分配、QoS(服务质量)和业务类型等方面有很大差异,所以需要有一种合作机制来分配共同的网络资源,而这种机制就要涉及到异构网络间的网络选择和资源分配等技术。在异构网络中,网络选
微量元素铁可以促进肿瘤的发生、生长和转移。铁螯合剂去铁胺(DFO)通常用于治疗铁超载疾病,包括癌症。但是最近有研究提出用铁螯合剂DFO处理细胞,会促进高转移性乳腺癌细胞吸