大规模图像语义分割全效表征研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:boblllll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文介绍了基于隐式语义推理和多尺度去卷积机制的大规模图像语义分割的全效表征研究。本论文的研究目标是通过开发语义分割相应模型及算法来捕获自然图像中的重要信息,从而构建结构化框架以完成像素点的预测和语义分割。该结构化框架包括三个主要部分:自然图像分割的隐式语义推理,大规模图像语义分割的多尺度去卷积网络以及来源于Youku和YouTube公开资源的视频对象的无监督语义分割。为了克服自然图像分割方法由于分割后的图像区域之间关联性不强所引起的人类感知偏差的不足,本论文提出的隐式语义推理采用一种更加条理性的方式来开发既定自然图像中全局区域和局部像素的特性,此方式避免了之前利用典型的超像素方法进行图像分割的单一性限制,即忽略了局部非相邻区域内像素的相似性。本文所提方法首先对自然图像进行横纵四分均匀切割,再通过设计颜色位置密度聚类算法进行利用切割后区域的数字标注,最后利用联合跨区域和跨尺度势函数的MRF-inspired模型,自动估计分割后的图像区域数目,使得每一块区域表示一个独立的物体,并且区域之间不失连续性,从而完成图像区域的语义分割,使分割效果满足人类的感知需求。上述方法在自然图像规模过大时,其语义分割效果会受到限制,为解决由此引起的算法精确率下降和时间复杂度上升的问题,本论文中提出的多尺度去卷积神经网络通过结合深度神经网络来解决图像的每一个像素点的标签分类问题,目的是在不损失准确率和时间代价的前提下,训练一个去卷积语义分割神经网络,可以同时进行目标检测和语义分割两个联合任务,这种神经网络通过引入多尺度去卷积机制来进行图像特征提取,该机制包含down-scale流和up-scale流,并且该神经网络的多尺度机制相较于多尺度输入方式效果更优。除了图像外,本论文还对当下流行的视频源如Youku和YouTube中的视频对象进行分割。对于视频对象分割,本论文采用了交互和非监督的方法,通过在视频第一帧中绘制简易线条,本文所提出的方法可以自动提取感兴趣的目标对象,从而进行高斯混合模型的标签迭代,算法参数更新和Graph Cut的操作,以此完成视频感兴趣区域的自动语义分割。
其他文献
本文介绍了一种脱壳去毛利工艺,即用加热法去除电机转子硅钢片和铝导条边缘毛刺工艺的机理、参数及优点。
近年来,人工智能技术引起了人们的高度重视,移动机器人领域逐渐成为当前世界各国研究的热点。移动机器人综合了计算机、自动控制、机构学、控制论等学科专业技术,成为人工智能发展活跃的领域之一。其中,路径规划与轨迹跟踪是移动机器人决策与控制中的核心技术,如何使移动机器人高效地规划出一条最优、安全的路径,同时实现精确的轨迹跟踪控制一直是一个具有挑战性的研究方向。首先,通过分析移动机器人环境建模方法,选择栅格建
见义勇为,自古以来都是被人们所颂扬的高尚行为,古今中外不乏有大量见义勇为先进事例被人们所熟知。在经济发展水平日益发达的今天,人们的道德底线却在逐渐下滑,出现了一大批
2009年12月15日,“教师教育发展与创新论坛暨纪念《北京市中小学教师继续教育暂行规定》颁布20周年大会”在北京教育学院隆重举行。教育部师范教育司司长管培俊,北京市人大常委
本文从两则案例为起点,引出未成年人见义勇为这一话题,从见义勇为的概念界定、国外主要国家关于见义勇为的立法情况、我国对于见义勇为行为的立法和实践现状来分析未成年人见
石匠沟矿区原本是菱镁矿区,笔者于2018年对其进行深部勘查时,新发现了共生的滑石矿,资源储量达中型规模,而且仅进行了局部控制,预计可达大型滑石矿床规模。滑石矿石工业类型
我国肢体残疾患者人数众多,且随着人口老龄化的加剧,肢体残疾患者的数量还在不断上升。随着现代医学技术的发展,越来越多的肢体残疾患者选择手术来进行治疗,但对于肢体残疾患
目的:探讨四个成串刺激(TOF)肌松监测在老年人气管全麻中的应用价值。方法:选取江门市新会区人民医院2012年9月-2014年9月收治的老年全麻手术患者80例作为研究对象,采用掷骰
视频对象分割技术是计算机视觉中一项基础而关键的技术,它旨在按照一定的标准分割出视频序列中人们感兴趣的区域,包括静态场景视频中出现的行人,动态场景视频中拍摄的主体对
由于大鳞副泥鳅的生长发育等生物学特性及食性等方面的特殊原因,人工苗种培育技术一直存在很大的问题,规模化仔稚鱼培育成活率低(不超过20%),致使人工繁殖工作长期没有实质性