复杂场景下基于深度学习的多目标跟踪方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:lyzwrf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉领域中,多目标跟踪是一个研究的热点方向,具有重大的学术价值。例如智慧城市中的全自动、全天候、实时监控的智能视频系统。在传统视频监控系统中,对于多目标跟踪,存在耗费大量人力资源和不能实时处理等问题,需要采用计算机视觉技术对监控画面进行智能分析与处理。基于深度学习的多目标跟踪技术是一种高效的端到端学习框架,深度神经网络模型是一种用于捕捉与目标跟踪位置强相关信息的有效方法。在实际复杂场景,如人群密度高、遮挡严重的区域,以及面临背景干扰问题等情况下,多目标跟踪轨迹的效果还是差强人意。为了提高轨迹预测的效果,本文通过提出基于深度学习的多目标候选区域特征提取方法以及结合轨迹置信度的分层关联策略,建立了基于残差网络的多目标预测轨迹分层关联模型。具体方法如下:首先通过卡尔曼滤波方法对跟踪目标运动进行预测,然后通过基于深度学习的目标检测方法,对跟踪目标所得到的候选框进行纠正,从而提高目标所在位置的跟踪准确率。然后通过分类网络对跟踪目标进行精确的分类。其中,在处理相似特征的目标时,基于神经网络生成每个目标的深层次隐藏特征,进而将最相似的轨迹链接起来,并通过区分两个重叠交错的候选轨迹,达到减少轨迹丢失,保持跟踪的稳定性的目的。最后通过分层数据关联方式对跟踪目标在不同帧生成的轨迹进行精确匹配。通过实验验证,本文所提出的模型在处理多目标跟踪过程中出现的误检问题、提高识别准确率方面,比现有方法有了一定的提高。
其他文献
在如今的线上购物网站、在线社区和社交媒体中,文本评论已经成为研究人员研究用户行为和理解各种现象的最重要的数据源。在电商网站上购物多样性的兴起,使得人们每天都能在网上购买自己需要的商品,同时也可以随时表达自己对某件商品的感受和意见。文本评论的情感分析引起了政治学、市场营销、传播、社会科学和心理学等领域的研究人员的关注。分析评论文本的情感倾向,在线上购物网站和社交媒体上研究用户行为是一个重要的研究方向
移动互联网的快速发展,极大推动了人们对基于位置服务的需求。作为基于位置服务要素之一的定位自然而然成为人们关注的重点。根据定位技术的适用范围,我们将定位分为室内定位和室外定位。对于室外定位已经有卫星定位这样成熟且已大规模应用的解决方案,与之对应的室内定位则还在研究阶段,原因在于室内环境的建筑结构复杂,人员流动频繁以及电磁环境复杂,导致室内定位误差较大。本文针对室内定位误差较大,准确度不高的问题,提出
眼动交互普遍应用在行为学分析、医疗辅助和智能化系统中。眼动交互的关键技术为眼动追踪和眼动行为识别。随着人工智能出现,眼动追踪和眼动识别应用了深度学习技术,实现了无需眼动仪也可完成相应的追踪和分类任务。本文重点就基于卷积神经网络(CNN)的视线追踪和眼动行为识别技术进行研究,主要工作有:1.基于卷积神经网络的视线追踪技术研究。基于卷积神经网络的视线追踪包含了独立于人(person-independe
Internet的快速发展带来了Web上的各种服务,例如电子邮件,购物,社交聊天,银行服务,娱乐等。人们可能拥有相当多的Web身份(即登录帐户和密码),从而导致一种称为“密码疲劳”的安全问题。丰富的Web服务的可用性使我们的生活变得方便,但同时也带来了挑战性的问题,包括密码疲劳、暴力密码破解或其他密码攻击,网络钓鱼,数据泄漏,甚至是来自量子计算机的攻击。用户一般需要使用帐户和密码来访问各种平台和系
近年来,随着社会各领域资源需求的迅猛发展,让信息技术的发展变得如火如荼。信息技术的飞跃发展,导致大量无规律结构的信息以文本形式展现在各领域。过量无结构的文本信息没有对应的技术进行处理与利用,导致流失过多的知识与价值,所以信息抽取技术应运而生。信息抽取是利用一定的计算机技术,从文本、语音、图像、视频等数据中找到他们传达信息的结构和方式,进行自动抽取信息并将其结构化显现出来的过程,而事件抽取,则是信息
Universum学习是一种建立在Universum数据上的机器学习模型。Universum数据指的是一种与二分类问题的数据处于同一域,但却不属于其中任何一个类别的数据。Universum数据含有该领域的先验知识,会对学习算法的分类性能起到重要的作用。因此,如何选取合适的Universum数据参与学习是Universum学习中的一个关键点。另外,为了建立较为准确的机器学习模型,传统的机器学习算法都
随着现代信息科技的不断进步,数据的维度急剧增长,使得人们难以把握数据的本质,进而对数据加以利用,而在特征选择、迁移学习等领域,受图嵌入思想启发,所构建的模型往往能取得较好的效果。因此,基于图嵌入并结合其他方法,挖掘数据的潜在几何结构,并获取关键特征,达到降维的目的,将是一个可行的研究思路。具体地,本文基于图嵌入的两种方式,即自适应图嵌入和预构建图嵌入,提出两个新的无监督特征选择模型,即联合图嵌入与
随着互联网的普及,传统的线下购物方式不再是购物的主体,线上购物平台不断发展。在这个背景下,虚拟换衣技术应运而生,人们足不出户就可以在虚拟平台上体验到不同服装的试穿效果。虽然虚拟换衣算法研究在3D建模和图像领域已经取得了巨大的进步,但在视频领域还几乎是处于空白。视频在互联网中还有很大的用户需求和商业潜能,将虚拟换衣算法和视频领域结合起来成了亟待解决的问题,本文具有非常重要的理论意义和应用价值。本文具
现如今的药物研发工程对资金、时间的花销和人才技术要求都很高,由于一个实验室的经费和人员往往有限,人们开始寻找一种门槛更低的研究方法,因此药物重定位这个可以使得制药成本和周期缩减的方法获得了广泛关注。随着近年来相关研究的积累以及药物数据库的开放使用,基于药物与疾病的异构数据的药物重定位已经成为当前的研究热点。虽然研究人员已经提出了很多不同的计算方法,但现有的计算方法大都存在着仅使用单一的相似性、不能
云存储服务以其存储方便、价格低廉等特点,吸引了大量的用户,而众多云存储用户上传的海量数据中存在许多重复数据。为了节约存储成本、减少网络带宽消耗,云存储服务提供商(CSP)会采用数据去重技术。而用户为了保护隐私数据不被他人窃取,一般会对数据进行加密,再上传至云端进行存储。由于加密密钥的不同,使得同一份文件加密后得到的密文也不一样,所以传统的重复数据删除技术往往不适合云存储数据去重。同时由于云存储用户