基于深度学习的半监督显著性目标检测研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:aiming6946s
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,基于深度学习的显著性目标检测算法被广泛提出,并且相较于传统算法获得了极为可观的性能提升。但是,基于深度学习的像素级图像分割任务往往需要精细的人工标注数据。为了减少对人工标注数据的依赖,当前的研究者们推动了一系列基于无监督学习和弱监督学习的显著性目标检测算法的产生。然而这些方法与目前基于全监督学习的方法在性能上依然存在较大的差距。在现实场景应用下,除了绝大多数的弱标签数据之外,还存在少部分可以使用的像素级标签数据。基于这种现实场景下的数据类型分布,半监督学习方法成为一种解决显著性目标检测中数据标注成本问题的更好选择。最简单的半监督学习思路是直接合并强弱标签数据集合,然后对显著性目标检测网络进行端到端的训练。但是这样的处理方式没有办法完全利用弱标签数据信息,导致模型性能甚至达不到仅使用少量真值标签训练网络所获得效果。在本文的工作中,首先利用神经网络模型学习简笔标签(Scribble Annotations)和真值标签之间的映射关系,获得高质量的伪真值标签,并将其作为弱标签数据进行下一段的训练。为了更好地利用弱标签数据,本文提出了一种使用双分支网络分别处理强弱两种标签数据的方法,在两个分支中分别进行强监督学习和弱监督学习。另外在双分支网络中设计了非对称的引导融合模块,使得弱分支网络更关注物体的位置轮廓信息,强分支网络更关注物体的细节信息。当梯度在双分支网络中回传时,由一个共享模块来获取强弱标签数据的联合隐藏特征,以此消除强弱标签数据的差异性对训练过程造成的负面影响。通过设计的强弱双分支网络结构和非对称融合模块,在仅仅使用少部分的像素级真值标签进行训练的情况下就可以带来较大的性能提升。本文的方法在6个公开的显著性目标检测数据集上进行了性能测试,并且与其他无监督学习、弱监督学习和部分先进的全监督学习方法的定量与定性分析。实验表明,本文的方法在性能指标和视觉效果上远远优于其他基于无监督学习和弱监督学习的方法,而且在只使用了全监督学习方法20%左右的真值标注成本的情况下,达到了全监督学习方法95%以上的性能效果,有效地减少了对像素级标签数据的依赖。
其他文献
行人重识别旨在判断行人在不同的摄像机视域下是否出现过,是图像检索的一个子问题。随着深度学习在计算机视觉领域的广泛应用,基于深度学习的行人重识别已经成为主流模型,并且在效果上远远超出基于传统机器学习的行人重识别方案。但在在实际的应用场景中,由于存在摄像机分辨率太低、姿态变化、光照变化频繁和遮挡严重等一系列问题,行人重识别任务仍然具有很大的挑战性。如何提取对光照变化、姿态变化和遮挡鲁棒的、有区分性的特
随着高通量技术的发展,产生了大量的生物组学数据,从生物组学数据中提取有意义的信息对于理解复杂的生物过程至关重要。生物组学数据的特点是“小N大P”,即特征数大,样本量小。传统的特征选择方法忽略了每个特征(生物分子)之间的复杂相互作用,因此从系统、宏观的网络层面研究特征(生物分子)之间的相互作用具有重要意义。本文对特征(生物分子)间的相互作用进行研究,提出了两种基于网络的生物标志物筛选方法。提出了基于
随着数字化时代的进步,基于云计算的机器学习预测也变得越来越广泛,然而传统的机器学习算法需要访问原始数据,这给用户数据带来了潜在的安全风险,尤其是一些隐私数据,比如医疗记录、财务数据等其他进入第三方渠道的信息。为了保护隐私数据不被泄露,实现安全的机器学习预测,可以在预测前对原始数据进行加密处理。同态加密技术可以对加密后的隐私数据做计算,这种隐私保护的方法使得安全预测成为可能。然而由于加密方案的巨大开
在现代国防的防空作战体系中,战场局势复杂且瞬息万变,使用AI进行动态辅助决策成为了一种迫切的需求。传统的依靠专家规则的AI模型过分依赖规则和专家的知识,而且不够灵活。基于深度强化学习的AI模型可以通过模拟或者真实的战场数据学习,使得决策更加灵活可靠。游戏环境一直都被认为是AI研究最理想的实验环境之一,在模拟仿真上的效果也很好。经过调研发现塔防游戏在游戏目标和操作上和防空作战有着一定的相似性。因此可
轮式移动机械臂由轮式移动平台和机械臂组合而成,由于其可以在空间内自由移动,故具有工作空间大、应用场景丰富、环境适应性强等优点。将轮式移动机械臂引入到智能工厂中,控制其按照参考轨迹进行加工作业,不仅可以代替传统固定式机械臂,还能提高加工效率,创新加工模式。为解决轮式移动机械臂结构复杂和多变量等问题,本文对轮式移动机械臂的加工作业过程进行划分,建立相应的数学模型和控制方法,以保证轮式移动机械臂在智能工
随着现代化信息技术的不断提高,互联网、物联网、5G等应用被广泛普及,海量数据是一种客观的存在,它们发挥着越来越重要的作用。时序数据为海量数据中的一种重要的结构化形式数据,如何高效的对各类时序数据进行异常检测是一个重要的研究课题,其旨在能够准确地从海量数据中识别出异常数据,为操作人员提供所监控设备各个部件的健康情况。本文借助深度学习强大的学习能力,对时序数据异常检测任务进行了深入的研究。针对时序数据
近年来,随着科技的进步,无人机机型向着小型化、低成本的方向不断发展。凭借着易部署、可控制、移动性的优点,无人机尤其是可悬停的旋翼无人机被大量应用在民用和商用领域,比如目标跟踪与检测、物流、辅助通信等等。其中,无人机辅助无线通信是目前的研究热点。在无人机辅助无线通信中,无人机可以通过安装小型的通信设备,为地面用户提供通信服务、作为中继节点为距离较远的收发设备建立连接、或作为移动汇聚节点采集地面无线传
近年来,随着各种人工智能(AI)应用不断地融入现实生活中并受到了日益广泛的关注,由深度神经网络(DNN)驱动的AI智能应用已经成功应用于许多现实领域。本文所研究是由DNN驱动的人工智能应用推理请求在5G移动边缘云(MEC)中的任务卸载策略问题,目的是在满足应用程序严格的延迟要求的前提下,尽可能多的处理DNN推理请求,以提高移动设备、基站和边缘服务器的能源效率。随着各种AI智能应用对精度、速度和能耗
自2007年发布以来,Android操作系统逐渐在智能终端的操作系统领域占据领先地位。官方平台和许多第三方市场都允许用户轻易地查找,下载以及使用大量的第三方应用程序,具有较好的用户体验。但与此同时,Android平台逐渐变成了恶意软件的主要攻击目标,恶意软件广泛存在各大应用市场,对用户的使用安全造成威胁。因此,高效地提高恶意软件的检测效率,提升模型鲁棒性,对其在现实背景下的实用性和维护Androi
作为水下计算机视觉的基础任务,精准的深度估计能够提升水下机器人的测距、定位以及目标抓取等任务的水平;高质量的颜色校正对于水下目标检测、识别等图像处理技术的发展具有重要意义。水下深度估计是对水下RGB图像中每一个像素相对拍摄源的距离进行估计;颜色校正解决图像中由水体环境导致的光衰减和后向散射等问题。但是,相较于陆上环境所具备的数据量大、技术研发成熟等优势,光照不均和能见度低等恶劣环境导致水下成像存在