基于区域合并的图像分割算法研究

来源 :福建农林大学 | 被引量 : 3次 | 上传用户:joseph0330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代各种成像设备和技术的快速发展,包括各种光学成像系统和微波成像系统,数字图像数据的自动解译与识别技术成为现代先进成像系统应用于实际环境的支持。图像分割技术是将图像分割成互补重叠的同质区域,这一技术是计算机视觉和图像处理领域中重要的基础性研究问题之一。主流的图像分割算法主要分成基于聚类的图像分割算法、基于区域合并的图像分割算法、基于图论的图像分割算法和基于分类的图像分割算法。基于聚类的分割算法是根据某种定义的距离度量或其它度量手段将数据集划分成多个子集;基于区域合并的分割算法是以初始分割结果为基础,通过相邻区域间的相似性度量在合并策略下实现图像分割;基于图论的分割算法是以无向图表示图像数据,将分割问题转为无向图的划分问题;基于分类的分割算法是利用已训练的分类器对图像像素进行标记。本文针对基于区域合并的图像分割算法中,相邻区域之间的相似性度量准则和区域合并策略这两个问题出发,提出分别应用于具有颜色(RGB)和深度(Depth)信息的图像(称为RGB-D图像)和合成孔径雷达(Synthetic Aperture Radar,SAR)图像的分割算法。本文主要内容如下:(1)针对室内场景RGB-D图像的图像分割问题,提出了一种无监督式的联合颜色和方向信息区域合并图像分割方法。首先,该方法利用多方向的双半圆高斯函数的数据驱动方式构造自适应权重,以此实现颜色和平面方向相结合的区域相似性度量;然后,通过区域间平面方向差异设计一个区域合并阈值函数引导区域合并过程。实验结果表明,该方法在边缘质量和区域质量都有所提高。(2)针对于在纹理与方向几乎相同的相邻区域分割结果不太理想的问题,本文从室内场景颜色和几何信息的特性出发,提出了一种用于室内RGB-D图像分割方法。首先,利用数据驱动的自适应权重结合颜色和深度信息,并且在主平面之间的边缘位置以平面法线差作为惩罚项,提出一种新的区域间相似性度量;在区域合并上,提出一个新的区域合并代价函数,该方法是在区域合并阈值上引入平面共面性;为了解决图像分割上出现的过分割问题,以分割结果为初始分割,结合区域面积与区域边界比值,提出了新的区域合并准则。实验结果表明,该方法与其它无监督方法相比,在边缘质量和区域分割质量上都具有明显的优势。(3)针对SAR图像中强斑点噪声和纹理信息,导致分割结果的边界形状杂乱问题,本文提出一种几何边缘惩罚区域合并的层次化方法将SAR图像分割成不交叠的场景区域。该算法对SAR图像提取的多尺度Bhattacharyya距离的阈值边缘强度映射(Edge Strength Map,ESM)进行分水岭变换,从而得到SAR图像的初始分割结果。利用相邻区域的无参数Kuiper距离作为统计度量和区域之间公共边界的几何信息为边缘惩罚项相结合,提出一种新的区域合并准则。根据区域合并准则,通过改变惩罚项中参数以逐渐增加边缘惩罚项的强度以此产生层次化分割结果。在真实SAR图像分割实验表明,与其它几种分割算法相比,该算法在复杂场景的SAR图像分割方面更加有效。
其他文献
博弈论从形成以来就受到了学者们的关注,学者们从不同的角度探讨囚徒困境博弈等一系列博弈模型,期望说明作为自私而理性的个体,合作是如何进行的。90世纪中叶复杂网络的发展丰富了博弈论的内容,复杂网络上策略更新与拓扑结构的共演化已经取得了一定的研究进展,在双人博弈模型上如猎鹿博弈等,大量分析表明个体间的关系变化会为合作带来促进作用。尽管研究取得了一些成果,然而由于社会复杂性,仍有大量问题值得深入研究,例如
2015年,随着《中国足球改革发展总体方案》的提出,校园足球成为中国足球改革的重中之重。校园足球活动得到了广泛的开展,各项基础设施日益完善。但随之而来的是校园足球对高
随着人工智能技术在世界范围内的迅速发展,各行各业已经进入智能化的时代。汽车驾驶也逐步向电子化与智能化发展。全球汽车数量的急剧增加使得交通拥堵和交通事故等问题日渐
随着人工智能技术的兴起,在物联网大规模应用的今天,越来越多的隐私信息将通过传感器进行数据交换,安全及人员鉴权问题被提上了日程。通过人工智能领域的身份认证的学习,介绍
中国共产党的领导是中国历史和中国人民的选择,实践已经证明并将进一步证明这个结论是完全正确的。要进一步深化对这个问题的认识,更加坚定全国人民一心一意跟党走的信心和决心,在党的领导下,奋力开启全面建设社会主义现代化国家新征程,谱写实现中华民族伟大复兴的新篇章。
传统的单标签数据挖掘,假定每个样本点仅属于一个类别,但是随着标注结构复杂程度的增加,每个样本可能同时属于多个类别,即多标签数据。在实际应用中,多标签数据标签的获取比
在图像获取过程中,由于相机和目标间的相对运动,会造成图像模糊。本文主要研究针对离焦模糊和全局、局部线性运动模糊的质量评价算法,以及针对全局和局部线性运动模糊的参数
几丁质是由N-乙酰-D-氨基葡萄糖通过β-1,4-糖苷键连接而成的多聚合物,是地球上仅次于纤维素的第二大可再生资源。N-乙酰-D-氨基葡萄糖是几丁质的完全降解产物,其在医药、食品、肥料、日化和能源等方面具有广泛的应用价值。目前,几丁质降解的传统方式是化学酸碱法进行降解,而在其降解过程中存在降解产物不纯和产生大量酸碱废液等缺点,使得几丁质资源未得到合理利用。而酶法降解几丁质是一种无污染、低成本、操作
声源定位技术是语音信号处理中的研究热点,也是许多技术后续处理中非常重要的一步。现有源定位技术大多数致力于远场源定位的研究,然而,当源信号处于近场时,远场源中假设的平
电喷射打印是基于电流体动力学的一种打印制造技术,在微纳三维结构的打印制造方面具有突出优势,并成为国内外研究的热点,在微纳传感器、组织工程、新一代电子产品等领域有着