基于深度学习的超像素分割算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jerryhua1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
越来越多的图像处理任务借助计算机完成,但图像中的像素数量巨大。为解决该问题,使用超像素表示图像,一个超像素包含多个颜色和空间相似的像素。由于超像素具有良好的图像表征能力和更高的计算效率,被广泛应用于计算机视觉任务。深度学习和端到端框架在包括计算机视觉在内的各个领域取得了重大进展,然而现有超像素算法无法以端到端的方式集成到后续任务中。现有算法包括传统算法和基于深度学习的算法。前者是不可微的算法,后者需要不可微的后处理步骤保证超像素的空间连续性,因此超像素的应用受到限制。基于此提出一种基于深度学习的超像素分割算法SIN(Superpixel Interpolation Network),它能以端到端的方式与后续任务融合。后续任务如视觉跟踪等要求实时性,因此超像素分割算法应能快速生成超像素。为去除后处理步骤,提出的算法在超像素生成阶段直接保证其空间连续性。首先对图像中像素点采样以初始化超像素,接着通过多个更新步骤将其余像素分配给超像素。每个更新步骤由水平方向扩展和垂直方向扩展构成,扩展的方式类似于插值,该设计是保证空间连续性的关键。更新步骤所需关联分数为卷积网络的多层输出经过卷积分类器的结果。SIN生成的超像素具有空间连续性这一特性将会被详细阐述。运行时间分析的结果表明SIN以大约80fps的速度运行,视觉效果分析和数值分析的结果说明SIN生成的超像素质量与其它算法相近。此外,通过设计一个简单但有效的损失函数,模型的训练时间大大减少。将SIN超像素应用于语义分割和显著物体检测任务,实验结果的提升可以证明SIN算法的有效性。
其他文献
纳米材料的各向异性在生物医学应用中具有独特的优势,其中形貌的各向异性在纳米药物研究领域受到更多关注。相对于无机纳米材料而言,聚合物纳米材料的生物安全性更好且种类丰富。共轭聚合物由于其特殊的共轭主链结构,在各向异性纳米材料的制备和调控方面具有潜在优势。本研究从共轭聚合物的分子结构出发,提出了一种全新的合成各向异性纳米凝胶的策略。该策略以共轭聚合物聚十烷-4,6-二炔酸(poly(deca-4,6-d
学位
为了提高盾构施工安全水平,开展有效的安全风险评估一直以来都是现场安全管理研究的重点。由于盾构施工现场的人、盾构机和环境紧密耦合成一个复杂的社会技术系统,系统安全与人-机-环的动态交互密切相关。因此,从人-机-环动态交互的系统视角评估盾构施工安全风险,分析微观的个体认知、盾构机运行和环境演化的交互作用对宏观系统安全的影响,有助于深入理解和把握现场系统安全,识别其中潜藏的关键风险因素,从而为现场安全管
学位
随着红外技术的发展,红外成像空中目标跟踪已得到广泛的应用,但红外诱饵等人工干扰会对空中目标跟踪产生严重影响。红外诱饵在辐射特性上既有压制型诱饵,又有相似型诱饵,在时空域上也表现出多种复杂的空间和行为特性,仍是目前空中目标跟踪需要解决的重要课题。本文针对复杂红外诱饵干扰条件下的目标跟踪问题开展研究。为了提升算法的抗红外诱饵干扰能力,本文采用了先对干扰事件和诱饵类型进行检测、判别,进而针对不同事件和诱
学位
随着人工智能和多智能体技术的发展,通信受限情况下的多智能体合作问题已成为人们关注的焦点。作为一种多人合作卡牌游戏,Hanabi游戏为研究多智能体间的交互提供了一个很好的场景。通过研究玩家在游戏中如何交流,探讨玩家传递信息的方式,不仅对人工智能理论发展起到推动作用,同时也能为现实中通信受限情况下的多智能体系统协同提供解决方案。论文对Hanabi游戏中玩家如何交流进行了研究。在对Hanabi游戏进行形
学位
宫颈细胞图像的分类和分割算法是计算机辅助宫颈细胞学筛查的重要基础。近年来基于深度学习的宫颈细胞图像分析算法以远超传统算法的效果得到了越来越多研究学者的关注。现有宫颈细胞图像分类和分割方法通常采用人工针对其他任务设计的通用网络结构,或专为宫颈细胞图像设计的特定网络结构。但由于通用结构未考虑宫颈细胞图像的特点且人工依据经验设计的网络结构存在主观偏差,精度和性能还有提升的空间。网络结构搜索以其针对特定数
学位
随着通信技术的迅猛发展,信息安全问题受到社会各界的广泛关注。在密码学中,序列密码体制的安全性取决于密钥流,而密钥流的安全性取决于随机数发生器。随机数发生器是序列密码设计中的重要环节,如何构造安全可靠的随机数发生器具有很高的研究价值。混沌是确定性系统中存在的一种内在随机现象,具有周期无穷大、不可预测性和参数敏感性等复杂的性质,很适合构造随机数发生器。因此,设计了一种基于混沌的真随机数发生器,具体研究
学位
随着移动互联网服务的快速发展,序列推荐系统在现代社会扮演着越来越重要的角色。一些研究表明满足三角不等式的度量学习相比于内积计算更能捕捉用户与物品之间的关系、以及用户之间的相似性和物品之间的相似性。但现有基于度量学习的序列推荐模型仍存在用户兴趣捕捉不完整、易产生度量空间冲突和无法区分负样本等问题。为解决上述问题,提出了基于多重对称度量学习的序列推荐模型,设计了四个独立模块来从用户长期兴趣、用户短期兴
学位
关系抽取任务旨在从复杂的非结构化文本中抽取结构化的关系事实,以标记实体对之间的语义关联,是信息抽取领域重要的研究任务之一。关系抽取的结果可用于知识图谱的构建,同时也为智能对话,知识检索等人工智能领域技术提供了重要的基础支持。现有的关系抽取主要聚焦于句子级别,即抽取位于同一句中实体之间的关系。然而在真实应用场景中,大量关系事实需通过多个句子所包含的复杂相互关系中推理得到。同时,实体间可能存在的非单一
学位
人工智能时代,机器学习在数据、模型和算力的加持下,成功推动了推荐系统、自动驾驶、机器翻译等一系列应用的成熟。现实世界中,标记样本集的获取往往成本高昂,如何充分利用无标记样本提升模型性能是一项至关重要的任务。正类和无标记样本学习(Positive and Unlabeled Learning,PU Learning)面临一种更特殊的场景,标记样本只有正样本,其余都是无标记样本。因为负样本的缺失,经典
学位
图流是一个包含时间信息的无限边流序列。作为一种实时动态的关联数据模型,图流结合了图的关联表示性和流的连续更新性,广泛应用于大数据应用中,比如新冠疫情期间的密接分析和智慧城市的车辆监控。为了管理大规模的图流数据,图流概要技术使用基于哈希的压缩矩阵近似地存储图流,并提供和图拓扑相关的查询。然而,现有的图流概要结构均没有考虑图流时间维度信息的存储,因此无法支持时间范围查询。设计支持时间范围查询的图流概要
学位