基于音频视频信息融合的人物跟踪及其应用

被引量 : 0次 | 上传用户:sduheaven
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文研究基于音频视频信息融合的人物跟踪算法以及对于现场档案系统的初步设计两方面。为了克服传统的只依赖视频或音频信息的跟踪算法在复杂和动态环境下的脆弱性,我们通过融合音频视频两方面的信息对人物进行跟踪,以提高跟踪的可靠性和鲁棒性。本文提出了一种新的基于音频视频信息融合的人物跟踪算法。该算法采用Importance Particle Filter作为融合工具,首先分别使用音频信息和视频信息进行跟踪,然后用跟踪得到的结果单独提出先验概率分布,依照先验概率分布采样后,再通过音频和视频信息融合的观察模型计算采样点权值,得到后验概率并进一步得到最终跟踪结果。我们的算法使得音频和视频信息的地位更为对称,从而能更好的发挥其互补作用。同时我们在算法中引入了反映音频和视频信息可靠性的权值,在算法运行过程中能动态调整这些权值。实验表明我们的算法比单纯使用视频信息的跟踪算法具有更好的鲁棒性,同时对光照条件改变、背景变化、人物交错等干扰都具有一定的鲁棒性。在该算法的基础上我们实现了一个实时人物跟踪系统,该系统能被应用在智能教室环境中,对前台的说话人进行跟踪并同时定向采集其声音,从而使得人物不再局限于麦克风的位置,而能在较大范围内活动。现场会议档案系统是普适计算研究的一个热点和实验环境,我们分析了基本的应用环境,对其设计了相应的场景、数据流、功能模块和系统结构,并初步定义了其中较重要的事件。我们设计了该档案系统所具有的两个特点,即实时性和语义性。实时性是指系统能对某些场景作出实时的反应,调整自己的行为;语义性是指系统将根据含有语义信息的“事件”等概念来对数据进行存档和检索。在现场档案系统中将集成基于音频视频信息融合的人物跟踪系统并将进一步结合说话人识别、人脸识别等身份识别技术来得到人物身份,从而为会议内容分析提供基础的信息。本文介绍了我们在这方面的初步结果。
其他文献
中华民族是一个重视家庭、重视家庭教育的民族,也积累了许多精辟的关于家庭教育的理论与方法。在现代社会,家庭教育不仅是家庭生活的重头戏,更是学校教育的有利补充,也是社会
聚四氟乙烯多孔膜(Porous PTFE)是聚四氟乙烯(ploytetrafluoroethylene,PTFE)薄膜在一定的高温条件下经单轴拉伸而形成的具有良好透气率、柔顺性、介电性能、生物相容性和优
目的 在我国,随着稀土应用的日益广泛,特别是稀土微肥、微饲被用于农业、畜牧业生产以来,越来越多的稀土进入环境、进入食物链。因此,稀土对环境和人体健康的影响引起了人们
现代公司制度移植到中国以来,一人公司就焕发出蓬勃的活力。特别是自然人一人公司受到中国文化传统的滋养,以家族企业形式大量涌现出来。从文化传统的角度深入探讨自然人一人
根据人体步态分析的需求,本文设计了一种基于微惯性器件组合和DSP的惯性步态测量系统。其目的是为临床医学研究提供分析工具,提供测量数据,以提高医学研究的理论水平。 本
随着科学技术的进步,电子化、精益化逐渐成为技术发展的方向。过去的机房ODF的工作已经无法满足日常工作的高效、快捷、规范的要求,越来越多的跳纤会增加光纤日常工作中误拔
用解析法对曲柄滑块机构进行运动分析,建立数学模型,给出部分计算结果,具有工程实际使用价值。
建国初期,中国共产党和人民政府对私人资本主义工商业采取的是利用和限制的政策,通过各种形式的国家资本主义不仅抑制了私营工商业的消极作用,而且扶植了对国计民生有利的服从于
语言究竟是一种客观存在,还是心理现象?上个世纪勃兴的逻辑实证主义和可及性理论在研究语言时虽然都借用了罗素的"摹状词"一说,但它们对语言存在的研究却采取的是不同的观点:
在黄土高原半干旱区,以主要粮食作物春小麦为研究对象,针对地膜覆盖小麦产量不稳定和可能的土壤质量问题,对不覆膜、覆膜30天、覆膜60天、全生育期覆膜等处理的春小麦农田产