基于全卷积模型的显著性目标检测算法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:wyywzc21200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
认知心理学家经过大量详尽的实验研究表明,人类具有快速获取视觉场景中显著的或者感兴趣的目标的能力。为了使现代计算机也具备类似的信息处理能力,越来越多的研究人员对视觉显著性目标检测技术进行了相关研究。近些年来,视觉显著性目标检测技术已经成为计算机视觉和图像处理领域的热门研究课题。视觉显著性目标检测技术的目标是辨识并分割出图像中吸引人类视觉注意的显著性物体或者区域。作为一种图像预处理方法,它不仅可以促进计算机对图像场景的理解,还可以普遍提高下游相关视觉任务的性能,如图像的识别、检索、分割、压缩、恢复等。同时,随着硬件技术的快速发展,显著性目标检测技术也在尖端科技领域发挥着越来越大的作用,如自动驾驶、人机互动、工业机器人等。因此视觉显著性目标检测技术的研究具有广泛的应用前景和深远的科学意义。当前,虽然在视觉显著性目标检测领域的研究已经取得了较大的进展,但是在杂乱场景、低对比度成像环境或者物体不明显时,显著性目标检测算法的精度和效率仍然不太理想。针对以上问题,本文将依托有效的深度学习技术,特别是全卷积神经网络模型,对视觉显著性目标检测算法进行相关研究。本文的主要工作和研究创新如下:(1)根据深度卷积网络的不同层的视觉特性,本文提出了一种基于多层次卷积特征聚合的显著性目标检测模型。具体地,为了更好地融合多层视觉特征,本文提出了一种基于分辨率的特征组合方法。该方法首先将不同分辨率下的深度特征进行适当的收缩或扩张,使其保持相同的分辨率,然后将不同层次的特征进行加权自适应聚合。该方法消除了多层次深度特征的分辨率不匹配问题,同时增强了深度特征的表示能力。为了促进多层特征之间的信息交互,本文还提出了多层次监督学习方式对网络进行训练。该训练方式首先将监督信息应用于网络的多个侧输出,然后将多个损失函数联合优化,完成多层次的显著性目标检测。它能够显著地提高模型对显著性目标的检测能力。本文所提出的算法具有很强的通用性,可迁移到其他有效的深度卷积神经网络上。在国际公开的测试数据集上,该算法的显著性目标检测效果相较于同时期其他算法有明显的提升。(2)针对现有的显著性目标检测算法常常忽略模型的鲁棒性,本文从卷积特征集成的角度,提出了一种基于不确定性卷积特征学习的显著性目标检测算法。该算法首先将随机失活(Dropout)进行基于特征元素的修正,得到的全新表示形式可认为是将特征元素进行概率化的集成。通过将其应用于卷积特征图上,可以提取到多层次不确定性卷积特征。基于卷积化的编码-解码结构,所提出的全卷积模型可以进行端到端的显著性目标检测。同时,为了有效地降低反卷积上采样过程中的“棋盘伪影”,本文还构建了一种混合上采样方式,它很好地继承了反卷积和插值操作的优势,可以提升预测图的光滑性。该算法相较之前算法在模型鲁棒性方面有显著提升,在检测精度和泛化性方面也取得了优异的结果。(3)针对现有深度模型缺乏对互补性特征和结构化监督信息的利用,本文提出了一种基于无损特征反射和结构化损失函数的显著性目标检算法。显著性目标检测任务主要关注前景和背景的可分离性。而图像本征反射和镜面变换可以很好地将图像中的信息进行分解。有鉴于此,本文提出的算法首先将原始图像通过镜面反射变换为内容保持的镜面图,然后利用对称全卷积神经网络分别提取互补的视觉特征,进而利用多层特征融合策略进行特征交互,以促进特征的融合。最终通过结构化损失函数进行监督训练得到精确的显著性图。通过大量的实验分析,该算法能够在国际知名的数据集上取得优异的性能,同时对显著性目标的边界精度也有很大的提升。最后,本文给出当前显著性目标检测算法仍面临的问题和挑战,同时针对这些问题给出了显著性目标检测算法的未来研究趋势。
其他文献
这项研究基于内部控制原则,调查了加纳公共组织内部控制有效性的决定因素。内部控制是一个概念,解释组织如何与最佳道德规范和标准保持一致。换句话说,内部控制是指组织为确
猪是我国重要的肉用畜种,通过遗传改良提高其胴体性状是猪育种工作的重要目标。采用基于数量遗传学为基础的常规育种方法进行胴体性状的遗传改良,进展较慢,且无法解析其遗传和变异的本质。采用数量遗传学和分子生物学相结合的手段进行遗传改良,可以加速遗传进展。分子遗传学可为数量遗传学的数学建模提供指导,而分子遗传学在现阶段解决不了的问题可以借助数量遗传学做出比较合理的推断。本研究通过对一个大白猪群体的胴体性状进
结构动力学设计的核心任务之一是优化结构的特征值和固有模态等动力学性质。具有良好动力学性质的结构在减振降噪、避免共振影响等领域有重要的应用。考虑特征值的动力学拓扑
山羊地方性鼻内腺瘤(Enzootic nasal adenocarcinoma of goat,ENAG)是由地方性鼻内肿瘤病毒2型(Enzootic nasal tumour virus 2,ENTV-2)感染山羊鼻内筛骨与鼻甲骨上皮黏膜组织引发的一种接触性传染病,在全球多地均有发生,近年我国也有较多报道,但在广西广东地区尚未见到,此外病毒检测方法比较紧缺、对当地病毒株全基因序列特征一无所知。因
因为三环传动自身具有承载能力强、传动比大、效率高、结构紧凑、载荷分布均匀、适用性范围广等优点,所以三环传动一直以来在很多领域广泛使用。对于三环传动,裂纹是影响齿轮传动系统的主要因素。在极端的工况下,齿轮容易出现疲劳微裂纹,进而造成裂纹扩展直至断裂,引起人员伤亡和经济损失。因此,从仿真角度研究齿轮裂纹,对于齿轮系统的齿轮故障监测、识别和诊断具有重要意义和潜在实用价值。本文运用机械疲劳理论和断裂力学理
本文以提高一氯均三嗪反应基团亲核取代活性为目标,通过将苯磺酰胺及其衍生物结构引入到三嗪环上,利用砜基的强吸电子作用降低三嗪环上的电子云密度,达到提高一氯均三嗪结构
单链磁体是一类在分子尺度表现出缓慢磁弛豫行为的分子纳米磁性材料,有望应用于高密度磁存储器件。围绕信息的写入与擦除问题,重大的挑战是如何利用光快速可逆控制单链磁体性
大跨桥梁作为城市的重要基础设施,其安全运营直接关系国民的生命财产安全,如何通过高效可靠的现代技术监测大跨桥梁的运营状况,是打造智慧城市的一项内容。近年来,国内许多桥
永磁同步电机(Permanent Magnet Synchronous Machine,PMSM)具有结构紧凑、功率密度与工作效率高等优于异步电机的特性,其高效节能优势与我国高速铁路与轨道交通绿色、可持续
中国是世界甘蔗生产第四大国,甘蔗渣(Sugarcane Bagasse,SCB)作为制糖业的副产物,同时也是一种可再生的生物质资源。广西是我国最大的甘蔗产区,具有丰富的甘蔗资源,为了使甘蔗渣能够高值化资源化利用,需要找到可以高效降解纤维素的菌株或酶,在酶解前需破坏甘蔗渣纤维原料的“顽抗性”,用以增加酶与底物的可及性,达到更好的酶解效果。甘蔗渣具有可再生、低成本、可生物降解、来源集中等优点,适用于工