基于孪生神经网络的单目标跟踪算法研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:DGFIDYRSTG
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于视频的单目标跟踪作为计算机视觉研究领域中的基础性研究一直广受关注。通过提取视频初始帧提供的目标信息及其周围的背景信息,目标跟踪算法对后续帧中目标可能出现的区域进行预测。单目标跟踪的应用价值在多个领域都有充分体现。因此,继续对单目标跟踪算法进行深入研究依然十分重要。由于卷积神经网络在计算机视觉领域中的优越表现,现在主流的单目标跟踪算法的研究大都基于卷积神经网络进行方法设计。然而,基于卷积神经网络的单目标跟踪算法存在运行速度慢,对目标响应不敏感且对目标位置的定位缺乏准确性的问题。针对以上问题,进行了以下工作:(1)提出超像素优化孪生网络跟踪方法在对现行的基于孪生网络跟踪方法进行充分分析的基础上,提出采用超像素分割算法对单目标跟踪算法进行优化。对常用超像素分割算法进行性能对比,确定适合单目标跟踪任务的超像素分割算法。利用超像素分割算法的结果明确图像中含有语义信息的物体边界,使孪生网络跟踪方法实现更加稳定的跟踪。最后利用单目标跟踪算法研究中的常用数据集进行实验,对优化前后的单目标跟踪方法在准确率和鲁棒性上进行对比,结果表明优化方法鲁棒性更强。(2)提出超像素分割网络的端到端跟踪方法因超像素分割算法是迭代式的聚类算法,对于尺寸十分敏感,跟踪目标的尺寸对跟踪方法的运行速度影响大。因此提出超像素分割网络的孪生网络跟踪方法,在少量增加可训练参数和计算量的情况下实现基于孪生网络的单目标端到端跟踪方法。在单目标跟踪方法研究中的常用数据集上进行实验,与使用超像素分割算法进行优化的单目标跟踪方法进行准确率等指标的对比,实验结果表明本方法的准确率更高。(3)提出注意力机制的孪生网络跟踪方法通过引入注意力机制和多尺度的空洞空间金字塔池化方法,设计基于孪生网络框架的单目标跟踪算法。通过空洞深度可分离卷积组成的多尺度空洞空间金字塔池化方法进行特征的有效提取,实现多尺度空间信息的利用。利用注意力机制使卷积神经网络对跟踪目标进行充分响应,使跟踪结果具有更好的准确性。最后在单目标跟踪算法研究中常用的数据集上进行实验,对比结合注意力机制的孪生网络跟踪方法和常用单目标跟踪方法的各项指标。结果表明本方法的跟踪结果更加精确,稳定性更高。
其他文献
随着数字媒体技术的普及和计算机视觉领域的快速发展,平面目标跟踪作为一种重要三维跟踪技术已被广泛应用于三维重建、军事制导以及无人机等多个技术领域。尽管众多研究者在该领域已经取得了丰硕的研究成果,但仍存在诸多问题尚未解决。例如,在背景复杂或者在视点快速移动的场景中,视频图像中纹理重复或者缺失会导致所提取的关键点特征信息不准确;超出视野或遮挡等场景容易造成基于区域的方法失效;视点快速移动则会引起跟踪目标
在互联网时代,Web应用发展迅猛并且正在成为许多领域的核心业务,是信息共享和资源获取的重要载体,其安全性和可靠性也成为了许多企业和研究者重点关注的问题。Web应用中的交互通常强烈依赖于用户的交互式输入,并且由于编程人员的经验不足或安全意识的缺失导致了输入约束漏洞,而这个漏洞常常导致应用程序被网络攻击,造成信息泄露和系统破坏等不可估量的损失。随着Web应用客户端计算功能的强大和用户对实时信息与实时互
濒危动物的保护对维持生物多样性至关重要。如果无法有效保护濒危动物,可能会导致地球生态系统失衡。随着全球变暖的加剧,濒危动物栖息地的丧失,濒危动物的保护变得越来越严峻。如果能及时并准确地识别濒危动物个体,就可以长期跟踪了解动物及其种群的行为和生活状态,从而更加有效地保护它们。为了确定某一只动物的身份,目前常采用的方法有人工目视检查、收集动物的排泄物或生物学样本、在动物身上附着传感器或者在体内植入微电
大坝水利工程作为最重要的水利工程之一,有利于调节河流径流,改善库区气候,也可以用于防洪、航运、发电、灌溉、水产养殖、旅游等重大工程。然而,大坝水利工程的体量一般很大。一旦发生事故,后果不堪设想。在水利水电建设工程中,灌浆工程是地基防渗和加固的重要工程措施,同时也是许多地下工程提高地基承载能力和防渗能力的技术手段。随着大坝水利工程数量的不断增多,工程所处地理位置的地质条件更加复杂多变,对灌浆工程质量
军事复杂软件系统继承了复杂软件系统和军事应用的双重复杂性,同时还受到军事领域的外部规则限制,形成了相对封闭的软件生态系统。2017年以来,美军加快了软件采购与开发方面的改革,2020年正式发布了“自适应采办框架(AAF)”在包括软件在内的6个领域全面实施“敏捷采办”,在“软件采办路径”中明确“政府和软件承包商应当采用‘现代迭代软件开发方法’”,下步将会全面实施敏捷开发、精益实践、Dev Sec O
随着信息化进程的加快,以人工智能为代表的新兴技术学科正不断演进发展。人脸识别技术作为人员辨别的重要表达,在生物识别领域中有着重要的研究意义。同时,其以非接触式识别的特点在监控、安防等工业生产领域得以广泛应用。目前,基于二维图像的人脸识别技术有着最普遍的运用,但由于二维人脸识别常受到光照、妆容、姿态等因素影响,从而导致识别效果不佳。相比而言三维人脸数据由于具有空间信息,在一定程度上可以解决二维人脸识
非限制场景下的人脸检测识别系统一直都是计算机视觉领域的一大挑战,特别是随着新型冠状病毒的流行,大量的人们戴上了口罩,需要一种不仅能够对非限制场景下人脸进行识别,还要能够对戴口罩的人脸进行识别的方法。本文提出一种基于人脸检测、遮挡物定位、人脸修复、人脸识别四个步骤的人脸识别方法。针对非限制场景下的人脸检测、人脸修复提出改进方案,同时标注了一种针对人脸遮挡物定位的数据集,最后整合四个步骤提出遮挡人脸识
医学图像处理作为学术界和业界的长期关注领域,具有很高的科研及应用价值。在医学临床实践中引入计算机辅助诊断系统,可以有效地减轻医生的工作压力,同时提高临床诊断准确率。伴随着人工智能技术的高速精进,基于神经网络的医学图像处理也越来越广泛地被应用到临床诊断中。基于神经网络的计算机辅助诊断系统大多依赖于海量数据进行训练学习,以实现令人满意的诊断判别效果。但是在实际生活中,很多疾病很难获取到大量有效的数据来
在视觉信息退化的环境中实现机器人的定位和导航,是目前视觉里程计的研究热点之一。目前大多数的视觉里程计基于可见光图像,只能在光照条件良好的环境中工作,当工作在夜间、雾天、浓烟以及粉尘等环境时,难以从连续的可见光图像中建立鲁棒的运动估计。热视觉里程计使用热图像作为视觉传感器输入,在上述视觉信息退化的环境中也能够鲁棒地工作,热视觉里程计能够帮助机器人实现弱光、烟雾等恶劣环境下全天候的定位和导航,这对于拓
时尚分析在时装产业、精准营销、社会行为分析等领域具有巨大的潜力,近几年越来越受到人们的关注。目前的时尚分析工作大多集中于分析服装的流行风格与流行趋势,而很少有学者关注人脸妆容的流行元素。人体的软生物特征提供人体中级描述,可以根据属性划分出具有某个特质的人群,如人脸具有多种属性,包括性别、年龄、种族、发型、发色等。本文主要致力于通过对人脸软生物特征的分析来获取唇色和发色的流行色。对于此任务,本文主要