论文部分内容阅读
[摘 要]建筑物提取是高分辨率遥感影像理解及应用的重要研究內容之一。针对高分辨率遥感影像建筑物光谱、形状异质性比较严重,且与道路等周边地物的特征容易混淆等问题,本文从视觉显著性的角度入手引导超高分辨率遥感影像的建筑物提取。所提方法采用随机森林回归机器学习算法检测影像中的建筑物显著性,实现了高分辨率遥感影像中提取建筑物的目的。对Vaihingen地区影像数据的测试结果表明,本文方法能得到较高的建筑物提取精度。
[关键词]建筑物提取,显著性检测,随机森林
中图分类号:TM512 文献标识码:A 文章编号:1009-914X(2017)12-0297-01
1 引言
随着遥感技术的快速发展,遥感影像的空间分辨率越来越高。相比于中低分辨率的遥感影像,高分辨率遥感影像中几何结构、空间特征、形状以及纹理特征等信息更加清晰,能够精细地描述地表目标,有助于地物目标更精确的判读解译。在高分辨率影像上进行地物识别与检测是遥感科学领域研究中的一大热点,建筑物作为城市区域地物类别中的主要内容和地形图中重要的成图要素,准确地获取其空间位置、形状等信息具有极其重要的意义。精确地提取建筑物在城市规划、城市动态检测、城市三维建模以及地形图更新等方面有着重要的实际应用。
2 原理与方法
2.1 算法基本原理
算法首先用基于图论的方法,对遥感影像进行多尺度的分割,得到在不同尺度上的超像素块区域;然后计算各个区域的特征向量,用随机森林学习区域的多类特征,构建随机森林回归器,采用监督学习的方法为每个区域进行显著性的赋值;在得到各个尺度的显著图后,利用最小二乘法将多个尺度显著图进行融合;最后,对最终的显著图使用自适应阈值的方法进行分割,得到最终分割掩膜图。
2.2 多尺度分割
本文所采用的过分割算法是由Felzenszwalb等提出的一种基于图论的影像分割方法。该方法基于RGB颜色空间,每个像素用5个分量表示,包括两个位置分量个三个颜色分量。在构造带权无向图时,图的节点为图像的像素,边的权值用RGB分量的欧氏距离来计算。算法中定义了区域内差异与区域间差异,若两个不同区域间的差异度小于任何一个区域内的差异度,则将它们进行区域合并;否则,保持这两个区域为单独的区域。
多尺度的分割图用S={S1,S2,...,Sm}表示。每个尺度的分割图Sm都是通过原图分割得到,包含Km个超像素块。S1是原图进行分割得到的结果,包含最多的超像素块。其余尺度上的分割结果都是通过S1中的超像素块合并得到的。超像素合并的规则参考了文[13]中的过程。首先合并S1中的超像素块得到S2。按照此规则依次进行,最后合并Sm-1中的超像素块得到Sm。
2.3 区域特征提取
在利用过分割方法得到影像超像区域后,提取每个超像素区域的特征。颜色与纹理是遥感影像最常用的低层视觉特征,可较直观的反映影像不同地物的属性。但是,对于显著性检测而言,对比特征又是其中非常重要的特征。下文将分别介绍超像素区域特征提取的方法。
2.4 显著性学习
2.4.1 区域显著性回归器学习
在每个尺度上,首先对分割训练图像获得的每一个区域Ri,在人工标记结果图上对应区域Gi。若Gi中所含像素的标记有 80%属于前景(或背景),则Ri标记为前景(或背景),且 Ri的标记值ai被设为 1(或0)。对每个区域作特征向量x∈Rd描述,训练样本中包含已标记的区域集合R={R(1),R(2),...,R(Q)},和对应的标记值A = {a(1),a(2),...,a(Q)}。
本文利用训练数据X = {x(1),x(2),...,x(Q)}和显著性得分 A = {a(1),a(2),...,a(Q)},学习到一个随机森林回归器,将每个区域的特征向量映射到显著性得分。随机森林显著性回归是t个决策树的集成,其中每个树由分枝和叶节点组成。每个叶节点存储一个特征索引f和阈值τ。给定特征向量x,树中的每个叶节点是基于特征索引和阈值(f,τ)作出决定。如果x(f)<τ,它遍历到左子节点,否则到右子节点,当到达叶节点时则给出其存储的预测值。设xp为影像I的一个特征向量,决策树将特征向量xp分入二元标记yp??0,1?中。随机森林是由t棵这样的决策树构成,每一棵树都有一个独立的参数?i 。假设i决策树叶子节点上的后验分布为,随机森林显著性回归最终的预测值sp是对所有决策树的预测平均值。
3 实验结果及分析
3.1 实验数据
实验所采用的数据为ISPRS提供的高分辨遥感影像数据集。数据为德国Vaihingen地区的正射投影影像,空间分辨率为0.8cm。实验将Vaihingen地区原始影像切割成一组100张大小为512*512的子块影像。每幅子块影像均注释像素级别的真实标记,真实标记为包含建筑物和非建筑物二类的二值掩膜图。
3.2 实验参数设置
实验中涉及主要参数是随机森林回归过程中决策树的数目T,随机森林显著性回归过程中,树越多,决策树之间的差异越小,可以实现更好的性能。然而,性能随着更多树木的采用而不断增加,但效率却大大降低。因此,选择设置T=200棵树来训练回归器以平衡效率和效果。
3.3 结果与分析
利用Vaihingen地区60张训练影像训练出显著性模型,另外40张通过显著性模型来检测出显著性区域,并通过自适应阈值将将建筑物提取出来。本文方法对多种类型的建筑物提取效果都很好,区域完整,杂质少。
为了定量评价算法性能,将算法自动提取建筑物的结果和Ground Truth进行基于像素的比较。设TP为算法自动提取结果中被正确分为建筑物的像素数;TN为建筑物被误分其他地物的像素数;FP为被误分为建筑物的其他地物的像素数;FN为未被正确分为建筑物的像素数。建筑物提取的定量评价指标:(1)准确率,Accuracy=(TP+TN)/(TP+FP+FN+TN);(2)精确率,Precision=TP/(TP+FP);(3)召回率,Recall=TP/(TP+FN)。利用30幅影像提取结果与真实标记数据,所计算出的平均准确率为93.42%,平均精确率为91.28%,平均召回率为88.75%。从三种评价指标来看,本文方法在对Vaihingen地区的影像进行建筑物提取时,效果较好。
4 結论
本文提出了一种基于视觉显著性的高分辨率遥感影像建筑物提取方法。该方法考虑到遥感影像中建筑物的特点,将建筑物检测问题视为视觉显著性检测问题。所提方法采用随机森林回归机器学习算法检测影像中的建筑物显著性,并通过自适应阈值对显著性结果进行分割,实现了高分辨率遥感影像中提取建筑物的目的。对Vaihingen地区影像数据的测试结果表明,本文方法能得到较高的建筑物提取精度。
今后将考虑遥感影像之间的协同显著性,以期为后面的分割提供更好的先验知识,进一步提高提取效果。
参考文献
[1] 孙显,王宏琦,张正.基于对象的Boosting方法自动提取高分辨率遥感图像中建筑物目标[J].电子与信息学报,2009,31(1):177-181.
[2] 高海燕,吴波.结合像元形状特征分割的高分辨率影像面向对象分类[J].遥感信息,2010(6):67-72.
[3] 乔程,骆剑承,吴泉源.面向对象的高分辨率影像城市建筑物提取[J].地理与地理信息科,2008,24(5):36-39.
[关键词]建筑物提取,显著性检测,随机森林
中图分类号:TM512 文献标识码:A 文章编号:1009-914X(2017)12-0297-01
1 引言
随着遥感技术的快速发展,遥感影像的空间分辨率越来越高。相比于中低分辨率的遥感影像,高分辨率遥感影像中几何结构、空间特征、形状以及纹理特征等信息更加清晰,能够精细地描述地表目标,有助于地物目标更精确的判读解译。在高分辨率影像上进行地物识别与检测是遥感科学领域研究中的一大热点,建筑物作为城市区域地物类别中的主要内容和地形图中重要的成图要素,准确地获取其空间位置、形状等信息具有极其重要的意义。精确地提取建筑物在城市规划、城市动态检测、城市三维建模以及地形图更新等方面有着重要的实际应用。
2 原理与方法
2.1 算法基本原理
算法首先用基于图论的方法,对遥感影像进行多尺度的分割,得到在不同尺度上的超像素块区域;然后计算各个区域的特征向量,用随机森林学习区域的多类特征,构建随机森林回归器,采用监督学习的方法为每个区域进行显著性的赋值;在得到各个尺度的显著图后,利用最小二乘法将多个尺度显著图进行融合;最后,对最终的显著图使用自适应阈值的方法进行分割,得到最终分割掩膜图。
2.2 多尺度分割
本文所采用的过分割算法是由Felzenszwalb等提出的一种基于图论的影像分割方法。该方法基于RGB颜色空间,每个像素用5个分量表示,包括两个位置分量个三个颜色分量。在构造带权无向图时,图的节点为图像的像素,边的权值用RGB分量的欧氏距离来计算。算法中定义了区域内差异与区域间差异,若两个不同区域间的差异度小于任何一个区域内的差异度,则将它们进行区域合并;否则,保持这两个区域为单独的区域。
多尺度的分割图用S={S1,S2,...,Sm}表示。每个尺度的分割图Sm都是通过原图分割得到,包含Km个超像素块。S1是原图进行分割得到的结果,包含最多的超像素块。其余尺度上的分割结果都是通过S1中的超像素块合并得到的。超像素合并的规则参考了文[13]中的过程。首先合并S1中的超像素块得到S2。按照此规则依次进行,最后合并Sm-1中的超像素块得到Sm。
2.3 区域特征提取
在利用过分割方法得到影像超像区域后,提取每个超像素区域的特征。颜色与纹理是遥感影像最常用的低层视觉特征,可较直观的反映影像不同地物的属性。但是,对于显著性检测而言,对比特征又是其中非常重要的特征。下文将分别介绍超像素区域特征提取的方法。
2.4 显著性学习
2.4.1 区域显著性回归器学习
在每个尺度上,首先对分割训练图像获得的每一个区域Ri,在人工标记结果图上对应区域Gi。若Gi中所含像素的标记有 80%属于前景(或背景),则Ri标记为前景(或背景),且 Ri的标记值ai被设为 1(或0)。对每个区域作特征向量x∈Rd描述,训练样本中包含已标记的区域集合R={R(1),R(2),...,R(Q)},和对应的标记值A = {a(1),a(2),...,a(Q)}。
本文利用训练数据X = {x(1),x(2),...,x(Q)}和显著性得分 A = {a(1),a(2),...,a(Q)},学习到一个随机森林回归器,将每个区域的特征向量映射到显著性得分。随机森林显著性回归是t个决策树的集成,其中每个树由分枝和叶节点组成。每个叶节点存储一个特征索引f和阈值τ。给定特征向量x,树中的每个叶节点是基于特征索引和阈值(f,τ)作出决定。如果x(f)<τ,它遍历到左子节点,否则到右子节点,当到达叶节点时则给出其存储的预测值。设xp为影像I的一个特征向量,决策树将特征向量xp分入二元标记yp??0,1?中。随机森林是由t棵这样的决策树构成,每一棵树都有一个独立的参数?i 。假设i决策树叶子节点上的后验分布为,随机森林显著性回归最终的预测值sp是对所有决策树的预测平均值。
3 实验结果及分析
3.1 实验数据
实验所采用的数据为ISPRS提供的高分辨遥感影像数据集。数据为德国Vaihingen地区的正射投影影像,空间分辨率为0.8cm。实验将Vaihingen地区原始影像切割成一组100张大小为512*512的子块影像。每幅子块影像均注释像素级别的真实标记,真实标记为包含建筑物和非建筑物二类的二值掩膜图。
3.2 实验参数设置
实验中涉及主要参数是随机森林回归过程中决策树的数目T,随机森林显著性回归过程中,树越多,决策树之间的差异越小,可以实现更好的性能。然而,性能随着更多树木的采用而不断增加,但效率却大大降低。因此,选择设置T=200棵树来训练回归器以平衡效率和效果。
3.3 结果与分析
利用Vaihingen地区60张训练影像训练出显著性模型,另外40张通过显著性模型来检测出显著性区域,并通过自适应阈值将将建筑物提取出来。本文方法对多种类型的建筑物提取效果都很好,区域完整,杂质少。
为了定量评价算法性能,将算法自动提取建筑物的结果和Ground Truth进行基于像素的比较。设TP为算法自动提取结果中被正确分为建筑物的像素数;TN为建筑物被误分其他地物的像素数;FP为被误分为建筑物的其他地物的像素数;FN为未被正确分为建筑物的像素数。建筑物提取的定量评价指标:(1)准确率,Accuracy=(TP+TN)/(TP+FP+FN+TN);(2)精确率,Precision=TP/(TP+FP);(3)召回率,Recall=TP/(TP+FN)。利用30幅影像提取结果与真实标记数据,所计算出的平均准确率为93.42%,平均精确率为91.28%,平均召回率为88.75%。从三种评价指标来看,本文方法在对Vaihingen地区的影像进行建筑物提取时,效果较好。
4 結论
本文提出了一种基于视觉显著性的高分辨率遥感影像建筑物提取方法。该方法考虑到遥感影像中建筑物的特点,将建筑物检测问题视为视觉显著性检测问题。所提方法采用随机森林回归机器学习算法检测影像中的建筑物显著性,并通过自适应阈值对显著性结果进行分割,实现了高分辨率遥感影像中提取建筑物的目的。对Vaihingen地区影像数据的测试结果表明,本文方法能得到较高的建筑物提取精度。
今后将考虑遥感影像之间的协同显著性,以期为后面的分割提供更好的先验知识,进一步提高提取效果。
参考文献
[1] 孙显,王宏琦,张正.基于对象的Boosting方法自动提取高分辨率遥感图像中建筑物目标[J].电子与信息学报,2009,31(1):177-181.
[2] 高海燕,吴波.结合像元形状特征分割的高分辨率影像面向对象分类[J].遥感信息,2010(6):67-72.
[3] 乔程,骆剑承,吴泉源.面向对象的高分辨率影像城市建筑物提取[J].地理与地理信息科,2008,24(5):36-39.