语义分割及其在图像检索中的应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:liangjingyu1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分割,旨在识别图像中物体的语义类别并定位其边界,是机器视觉领域基础和核心的问题之一。虽然历经了几十年的研究,但已有语义分割系统在处理复杂自然场景时的表现依然不尽如人意。作为像素级分类问题,语义分割致力于获得具有视觉均一性和语义一致性的区域,在识别语义类别、分割复杂物体、定位分割区域边界等问题上不断尝试进取。本文的研究目标是提出能从本质上克服语义分割所面临的各种困难的算法,提高分割的准确率,增强分割系统对复杂场景的适应性。本文提出的语义分割算法被应用于基于内容的图像语义检索任务,能够获得更加符合人类理解的高精度检索结果。  本文的主要贡献如下:  1.在传统机器学习的框架下,提出了一种结合深度概率边缘信息的图像分割方法。首先利用具有自适应色彩带宽的均值漂移算法对彩色图像进行预分割,接着对彩色图像边缘进行融合计算得到深度概率边缘的估计,最后利用可靠的概率边缘完成对预分割结果的校正。该算法可以有效地利用深度信息,减少因色彩变化而造成的过分割现象,较好地解决色彩相近的物体相互遮挡时难以分割的问题。  2.以深度学习为工具,提出了若干基于深度神经网络的语义分割算法。  首先从有效利用图像上下文关系的角度出发,提出了一种利用深度信息的深度卷积马尔科夫随机场方法,据此可以建立色彩、位置、深度三者之间的图像上下文长程依赖关系,从而很好地提升语义分割在语义标签的兼容性和预测物体的连续性上的表现。  其次结合传统方法和深度学习方法各自的优点,提出了一种基于RGB-D图像正则化的全卷积深度神经网络方法。由于使用人工设计的底层特征替代深度神经网络提取的特征,减少了系统在信息表达上存在的冗余性。该方法能够有效地减少语义分割网络的层数,提升模型的训练效率和语义分割的准确性。  最后为了准确定位语义物体的边界,提出了一种基于宽残差提纯的边缘保留网络模型。该模型利用宽残差的跨层结构来实现低层结构特征和高层语义特征的融合。所设计的残留特征金字塔可实现对多分辨率特征的融合,提升模型对多尺度物体的语义分割能力。  3.在基于深度学习的语义分割中,提取的特征既是对图像视觉内容的表述,又是对图像语义内容的表征。将其应用于基于内容的图像检索可以缩小语义鸿沟。作为本文所提出的语义分割算法的一个应用,提出了采用简单的余弦相似度来实现基于内容的图像语义检索的方案。为了提高检索的效率和精确度,设计并实现了一种二步检索策略。首先在语义分割网络中增加哈希编码层,利用适当设置的阈值获得图像的二值哈希编码,结合汉明距离可实现粗略检索,获得检索子集。其次在检索子集中,利用语义分割网络提取到的特征进行精细检索,据此可在有效节省存储空间的条件下,高效率、高精度地实现基于内容的图像检索。
其他文献
移动机器人是机器人研究领域的一个重要的分支,近年来得到了飞速的发展,在工业自动化、采矿、排险、军事、服务等领域得到了广泛应用。移动机器人路径规划是指在具有障碍物的
近年来,微电网技术迅速发展,以降低能源成本,减少碳排放量,提高服务可靠性为目标,协调微电网内的可再生能源,存储装置,可控负荷等设备,进而实现微电网的安全、稳定、经济运行。光伏发
智能控制是在人工智能与自动控制相结合的基础上形成的一门交叉学科.Agent,特 别是Multi-Agent作为分布式人工智能的新技术,已经成为人工智能领域研究的新热点之一 ,并取得许
该论文研究了单件小批量订单生产类型企业的生产计划理论与方法,并结合企业的实际需求,实现支持生产计划管理决策的智能决策支持系统.
随着工业控制系统自动化和信息化的加速融合,工业控制系统信息安全形势越来越严峻。以伊朗核设施遭受震网病毒攻击为代表的层出不穷的安全事件引起了业界广泛关注,颠覆了传统上
该论文首先讨论了电子商务及其相关技术,并针对论文的论述,重点分析了数据加密算法、安全认证手段及安全电子交易规范(Secure Electronic Transaction).论文分析了当前电子商
该文主要论述心率变异性分析方法、测量标准以及其应用,并在此基础上重点分析相关的时域分析和频域分析方法,引入计算机处理技术,运用计算机实现数字信号处理技术在心率变异
皮肤胆固醇的升高与动脉粥样硬化性疾病患病风险的增加显著相关,可以作为检测这类疾病的新型生物标志物。研究皮肤胆固醇的检测方法和系统,可以实现对动脉粥样硬化性疾病的早期
学位
该文介绍了一种无刷直流方波电动机调速系统.该系统以80C196MC单片机为核心,并 外加逻辑电路构成控制器;主回路于关器件采用IGBT,实现了PWM桥式调制方式的电机数字 控制.还实