基于深度学习的目标检测与跟踪算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:nm680nm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频目标分割(VOS)是对视频序列中的一组目标对象进行像素级分类的问题。近年来,它在自动驾驶、监控和视频编辑等领域得到了广泛的应用,受到了广泛的关注。VOS是一个非常具有挑战性的问题,因为在推理过程中目标对象仅由第一帧参考掩膜定义,没有其他先验信息的假设。因此,VOS方法必须利用这个非常有限的目标信息,以便在后续帧中执行分割。如何捕捉和利用这些有限的信息来准确地划分目标仍然是一个基本的研究问题。细胞检测与跟踪是VOS在医学领域的热点。这对于研究药物刺激下细胞的运动规律有着重要的意义。主要难点是如何有效地处理外观变化和相似的背景对象,同时保持准确的分割。大多数以前的方法在第一帧微调分割网络,导致不切实际的帧率和过拟合的风险。最近的方法集成了生成目标外观模型,但要么鲁棒性有限,要么需要大量的训练数据。本文通过构建一个可训练的VOS网络结构来解决这个问题,采用Py Torch作为网络的开发架构,网络结构集成了特征提取器、标签产生器、权重预测器、目标模型以及解码器。针对小样本问题,采用数据增强操作产生足够的训练图像。特征提取器对训练图像和标签进行特征提取,从而产生更多可用信息,同时特征提取器也为后续标签产生器和权重预测器提供支持。设计了一个小样本学习器,在简洁的目标参数模型中捕获目标信息,并通过最小化分割误差来预测目标模型的参数。目标模型预测目标掩膜的中间表示,然后连同图像特征一起输入分割解码器生成最终预测,预测结果进一步作为参考信息反馈给网络。进一步让模型实现了“元学习”的能力,超越了标准的小样本学习范式,利用从旧任务学习到的先验知识指导目标模型对新任务进行学习。由标签产生器学习多通道的掩膜编码,该编码被小样本学习器用作标签来训练目标模型。这使得的目标模型能够向测试帧中的分割解码器提供更丰富的特定于目标的信息。此外,为了引导学习器关注目标中最关键的方面,还构造了权重预测器来预测小样本学习目标中不同元素的空间重要性权重,使得计算的损失更灵活、更准确。方法快速,容易训练,并且对于训练数据有限的生物医学图像,例如细胞图像,较为有效。对具有挑战性的You Tube-VOS数据集进行了实验,网络架构具有较良好的性能。
其他文献
经济政策对我国经济建设的各方面起着关键性的作用,我国政府出台的政策对市场的经济主体起着重要的引导作用,经济政策在产业发展方向上有举足轻重的作用。我国经济政策在各个时期各个经济阶段都有不同的调整如货币政策或财政政策的调整,促进我国充分就业,国民经济稳定增长,但是经济政策的频繁变动带来了经济政策不确定性上升的问题,经济政策不确定性又给国民经济发展带来了企业管理者信心下降和产出降低等负面影响。企业是市场
学位
随着可穿戴技术和人工智能技术的飞速发展,手势识别技术被广泛的应用于游戏交互、智能驾驶、AR交互和手语交流等领域。基于配置多传感器数据手套的手势识别技术由于其使用场景不受限和交互特征明显等优点,在人机交互领域也取得了众多的应用。现有的手势识别技术多关注实验环境下的模型准确性,而忽略了实用环境下对不同场景和不同用户的个性化适配。通用的手势识别模型对不同的用户识别准确率存在较大差异,不能满足实际使用要求
学位
随着工业技术的进步,制造业日渐趋向于智能化、自动化和数字化,工业生产效率提高的同时,产品质量的提升也愈发重要。在三极管生产过程中会由于操作工艺等原因出现残次品,为保证三极管使用过程中的正常使用,对三极管的缺陷检测越来越重要。本文对三极管生产过程中出现频率较高的几种缺陷,分别使用基于经典视觉和基于深度学习的方法对三极管进行了缺陷检测。基于经典视觉的方法,是基于正样本模板匹配的思想,对三极管进行缺陷检
学位
在弱光环境中移动设备的成像始终是一个具有挑战性的主题。暗光下长曝光图像亮度自然且噪声小,但存在一定的图像模糊;与之相反,短曝光图像的亮度偏低、存在一定的曝光和颜色问题并且噪声大,但短曝光图像不存在运动模糊。长曝光图像与短曝光图像在一定程度上存在着互补性,在暗光条件下,结合长/短曝图像对的各自特点进行图像修复是可行的。本文通过对长/短曝图像的成像特点进行分析,提出一套接近真实图像的数据合成流程,并从
学位
在实际工程问题中,常常会遇到需要同时优化多个目标的场景,针对这种应用问题科研人员提出了多目标优化算法。差分进化算法是一种非常有效的启发式智能搜索算法,对种群的聚类操作可以提高解的分布性,将三种思想结合的算法能够较好地解决多目标优化的问题。然而,如何平衡差分进化算法对控制参数敏感性和聚类操作的参数变化性是该算法的短板,本文提出基于聚类的参数自适应多目标差分进化算法。在种群迭代过程中各种聚类形式自适应
学位
直/气复合控制拦截导弹相较于传统的纯气动控制导弹具有响应速度快、可用过载大、工作区域广的优点,这让它成为新一代精准拦截武器的首要选择。但直/气复合控制系统因执行机构的特性不同而具有了很高的复杂性,复合控制器的设计也不能按照常规的单一控制器进行。虽然复合控制器的设计方法众多,但有相当一部分控制器设计方法所基于的对象精确数学模型都是线性定常的,这不符合实际过载跟踪过程中的导弹模型。本文将对象中随弹体姿
学位
转台空间指向精度是评价转台性能的重要指标,传统的指向精度测量是根据国军标中对转台的各轴性能进行测试,然后利用指向精度模型去计算指向精度,或利用各种光学仪器对指向精度进行测量,设备昂贵,操作复杂。基于视觉方法的位姿测量方法,原理清晰,操作简单,但目前的研究无法达到指向精度测量所需要的精度。为了探究视觉方法进行转台指向精度测量的可行性,分析影响视觉测量方法的精度的影响因素,为后续研究打下基础,本文对基
学位
近年来,股市证券市场大幅度波动,全球经济环境持续低迷,企业发展受到全球证券市场的影响停滞不前。在这种环境中,投资者变得越来越谨慎,对投资信息的需求愈发细化,不仅需要财务会计信息,更加关注企业的风险信息。为了满足投资者的诉求,2007年,我国证监会对于公司年报内容也做出了一定的要求,必须要把公司面临的风险进行披露。并在2012年提出,公司年度报告应报告发展存在的重大风险,并提出行之有效的解决方案。风
学位
近些年,机器学习尤其是深度学习技术迅速发展,在多个业务领域都有广泛的应用。但是,越来越多的应用场景不仅要求模型可以达到一定的预测性,还希望可以获得模型对所做决策的解释。然而,绝大多数机器学习和深度学习模型都是黑盒模型,极难给出对所做决策的解释,这种模型的不透明性催生了对黑盒模型可解释方法的研究。在项目组研究的电网项目中,也有对机器学习模型做解释的需求。因此,在具体课题问题的背景下,本文开展了面向黑
学位
全驱系统方法是一种基于高阶全驱系统(High-order Fully Actuated Systems,HOFA)模型的控制系统分析与设计的方法论,它为控制理论研究开辟了一条崭新的途径。受物理上全驱系统控制特性的启发,全驱系统方法的出发点是通过变量消元和等价变换将原系统化成一个数学上的高阶全驱系统,再对其进行控制分析及设计。随着该理论方法的发展及相关研究的深入,全驱系统方法正呈现出多方面的优势,也
学位