【摘 要】
:
目标跟踪是计算机视觉领域的研究热点之一,在民用和军事等方面被广泛应用。在实际应用中,由于目标物体自身的变形、旋转、缩放以及外界环境的干扰如光照、遮挡等原因,目标跟
论文部分内容阅读
目标跟踪是计算机视觉领域的研究热点之一,在民用和军事等方面被广泛应用。在实际应用中,由于目标物体自身的变形、旋转、缩放以及外界环境的干扰如光照、遮挡等原因,目标跟踪的鲁棒性和精准度常难以保证。近年来基于核相关滤波的目标跟踪发展迅速,其基本思想是利用目标及其周围背景的信息密集采样,并将基于核相关滤波分类器的求解转换到傅里叶频域中实现目标跟踪。该类方法能够充分利用和实时更新目标及其紧邻背景的特征表达,极大的提高跟踪的精确度和实时性。本论文以核相关滤波为理论基础,引入基于显著性的目标物体检测和目标分块跟踪的理论,分别从全局跟踪和局部跟踪出发构造出两种目标跟踪方法,并将其应用到奶牛行为监控和识别。本论文主要贡献如下:(1)提出了一种基于联合核相关滤波的目标跟踪方法。首先,在亮度域对目标区域建立纯目标表观模型,同时对目标扩展区域建立目标背景表观模型;并利用基于最小生成树的显著物体检测计算目标相关的显著性度量,据此在显著度域对目标进行特征提取构建目标显著度表观模型。然后基于亮度域和显著度域的表观模型构建出两个核相关滤波器和它们的联合器。最后,将两个核相关滤波通过联合器联合起来对目标进行跟踪。具体而言,本方法将在亮度域使用基于目标背景的表观模型的核相关滤波器对目标位置进行初步的预测;利用联合器评估目标预测值的准确性,当准确性较低时在显著度域进行第二次核相关滤波以纠正目标预测误差,从而克服核相关滤波算法在遮挡、光照等问题上处理的不足。实验结果表明,提出的方法在处理遮挡、光照变化、快速运动等挑战中具有良好的效果,并且在与现有的跟踪算法的比较重,体现出了一定的优越性。(2)提出了一种基于最优分块识别的目标跟踪方法。该方法首先构建目标多尺度分块的表观模型,并以核相关滤波为基本算子对每个分块进行跟踪;然后,采用混合高斯模型来替代传统的高斯模型对分类器的训练进行优化,实现分块的精准跟踪;再通过霍夫投票和分块跟踪结果确定目标跟踪结果;最后通过分别更新异常分块和非异常分块实现分块表观模型的更新,以适应目标表观和周围环境变化,实现目标的持续精准跟踪。大量验证实验表明本文方法在位置精确度以及跟踪成功率均有一定的优越性,并且在处理背景杂乱、光照变化以及尺寸变化的挑战中有比较好的效果。本文最后将提出的方法应用于奶牛视频监控中。奶牛的健康状况与日常生活的各种行为都有着密切的联系,并且奶牛的健康状况直接影响牛奶的产量、奶质等牛奶的指标。通过对奶牛进行目标跟踪,借助目标位移的速度、位移的相对距离和目标的尺寸变化等参考量度可以识别出奶牛的行走和跑跳等运动行为,并且通过对跟踪轨迹进行分析,能够分析得到奶牛的运动方向、运动趋势以及运动范围,从而实现对奶牛的仿效行为、回家行为等行为的识别和监控,进而实现奶牛的精准养殖以及健康养殖,节约奶牛管理的成本以及提高奶牛产奶的质量。实验结果表明,本文提出的方法在奶牛的视频跟踪有着良好的应用。
其他文献
视频人体动作识别是计算机视觉领域中尤为重要的一名成员,它广泛应用在智能监控、视频检索和人机交互等领域,受到了很多研究学者的关注。随着深度学习在各个领域的渗透发展,研究学者将深度学习方法应用到视频人体动作识别中,但大多数算法在背景复杂、目标不单一和干扰较多的场景中的识别效果不尽人意。针对这些情况,本文围绕着计算机视觉研究的初衷—模拟人类视觉系统的信息处理机制,提出建立一个整合视觉注意机制与深度学习的
我国自古以来就是农业大国,农业的发展关系到人民的生活、社会的稳定和国家的长治久安。农业科学技术传播和发展是解决农业发展问题的根本途径,农业技术推广服务体系将“科学
定向问题(Orienteering Problem,OP)是一类特殊的NP-hard组合优化问题,其基本定义为:在指定的时间限制内有序的经过部分带有一定收益的点,使形成的路径最终获得的收益最大。
作为分布式人工智能的重要分支,多智能体系统能够把大而复杂的系统转化为小的,彼此相互通信的,易于管理的系统。近年来,多智能体系统在许多实际工程领域应用广泛,受到了国内外控制领域专家学者的极大关注。在多智能体系统协同控制中,一致性作为基础性问题更是成为关注热点。迭代学习控制以其能够在固定时间区间内完全跟踪期望轨迹的特点,被广泛应用到具有重复运行性质的多智能体系统的研究中。然而在实际多智能体系统的迭代学
随着市场竞争的加剧,并购成为许多企业提高竞争力的重要途径,然而很多企业由于缺乏资金使得并购计划只能搁浅,这种情况下便催生了“PE+上市公司”模式并购基金。该种并购基金由上市公司和私募合作成立,上市公司仅需出资较小份额,剩余资金则由PE进行筹集。通过这种运作模式,上市公司不仅减少了并购对企业资金的占用,还可以借助PE在资本运作和并购领域的经验帮助企业实施并购。因此,“PE+上市公司”并购基金自201
终止原模图 LDPC 卷积码(Terminated Protograph-based LDPC Convolutional Codes,TP-LDPC-CCs)结合了原模图LDPC码和LDPC卷积码的优点,具有多变的编码构造方式和优异的性能,有着广泛的应用前景。在此背景下,本论文主要研究了TP-LDPC-CCs算法及其FPGA(Field Programmable Gate Array)硬件实现,
本文对2015-2019年坦桑尼亚接收布隆迪的难民政策进行了定性评估,这一评估具有重要价值。因此,本文考察了坦桑尼亚在接收布隆迪难民案例上如何施行其移民政策。依据1998年《难民法》与2003年坦桑尼亚的难民政策,坦桑尼亚在布隆迪动乱后立即表示愿意接收布隆迪难民。历史上,坦桑尼亚政府曾多次接收来自其邻国的难民。坦桑尼亚自1961年从刚果、布隆迪与卢旺达中获得独立后便开始接收难民。2015年,时任布
随着互联网的高速发展,以及多媒体设备的普及,文字与图片作为重要的信息载体已经不能满足当前社会的需求,而视频逐渐成为信息传递的重要成员。在不同场景中有效地分析视频中的内容具有极大的应用价值,由于视频中存在着大量的序列图像,若仅将这些图像分别独立地分析将丢失原本存在于序列图像之间的关联信息,使得难以达到分析目的。为此,本文以序列图像作为基础、三维物体分类任务和动作行为识别任务为应用场景,分别提出有效地
该翻译报告选取美国司法部监察长办公室发布的一篇审查报告的部分内容作为源语文本。该审查报告反映了美国司法部执行重要证人法规情况,其中涉及到司法部及各执法部门职权,包括总监察长办公室和联邦调查局,重要证人法规,以及国际恐怖主义调查等。该审查报告反映美国国情及法律特色,因而翻译该文本具有价值。根据赖斯的文本类型理论,文本类型分为三类,即信息型文本、表达型文本和操作型文本。赖斯指出,翻译需首先确定文本类型
目的:探讨T细胞淋巴瘤(T-cell lymphoma,TCL)组织中核因子-κB(nuclear transcription factorκB,NF-κB)、谷氨酸-半胱氨酸连接酶催化亚基(glutamate-cysteine ligase catalytic subunit,GCLC)和谷氨酸-半胱氨酸连接酶调节亚基(Glutamate-cysteine ligase regulatory s