论文部分内容阅读
城市地物目标遵循特定的空间关系,空间集聚成相同功能性的区域,即城市场景,例如功能区、商业区、居民区。可靠的城市场景分类图对于城市规划和城市分析至关重要,因为城市场景的空间分布可以反映自然与社会经济共同作用下的特大城市的复杂环境。近年来,高分辨率遥感影像被广泛用于绘制城市场景分类图。但是,由于底层特征和高级语义之间存在较大的语义鸿沟,使得基于高分辨率遥感影像的场景分类和理解十分具有挑战性。当前,大多数现有的场景分类方法,例如视觉词袋模型,中层特征编码,主题模型和深度神经网络皆存在以下两点问题:1)在场景分类时,上述方法不具备识别场景内部构成目标和目标之间空间关系的能力;2)由于规则块状分割的场景不具有地理意义,且现有的数据集场景类别与城市需求的场景分类系统不一致的问题,基于高分辨率遥感影像的场景分类结果难以应用于实际的城市规划与分析中。针对高分辨率遥感城市场景分类中所面临的难题,本文开展了基于多对象空间上下文关系的场景分类方法,将对象的共生关系和位置关系结合起来,解决了传统弹力直方图不能描述多个目标之间位置关系的缺点,拓展了费舍核编码的应用环境。借助多源数据形式多样,社会经济语义信息丰富的特性,将其和遥感影像结合,解决仅基于高分辨率遥感影像的场景分类结果马赛克,分类系统与实际需求不一致的问题,使得场景分类图能成功运用于实际的城市分析中。本文的主要工作内容可以归纳为以下三点:(1)城市场景分类的基本方法与理论。本文回顾了基于高分辨率遥感影像的场景分类方法,介绍了面向对象分类方法、语义目标关系挖掘方法和常见分类器。同时,介绍了基于多源数据的场景分类方法,以开放街道地图(OpenStreetMap,OSM)数据和感兴趣点(points of interests,POIs)数据为例进行了详细的阐述。此外,还总结了高分辨率遥感影像和多源数据的融合方式,并重点阐述了概率主题模型和深度学习。(2)基于空间上下文关系的自底向上的场景分类方法。在该方法中,地物目标的共生关系特征由基于目标的费舍核编码建模,而位置关系特征由多目标弹力直方图表示。多目标弹力直方图是在传统基于一对目标的弹力直方图上的演变。弹力直方图不仅具有旋转和镜像不变的特性,而且可以通过计算多个地物目标之间的作用力来获取场景的空间分布。由于利用了目标信息的先验知识,所提出的方法可以解释目标及其关系,以便了解场景的结构布局。(3)基于点线面对象的多源地理数据的场景分类方法。在该方法中,视POI数据、OSM数据和遥感影像数据为点、线、面数据,整合三种类型的数据来进行场景分类。具体包括:在点对象上,对POI数据按照子类重分类;在线对象上,OSM中以道路网数据作为线对象的作用是为POI和高分辨率影像提供场景单元的边界,提供街区级场景;在面对象上,引入基于多尺度采样和卷积神经网络的连续微调方法来获取地块中高分影像的类别,获取面级尺度的场景信息;在分类标准统一方面,为了使场景类别与城市规划实际需求一致,采用基于规则的词袋模型将POI和高分影像的类别映射到定义的场景分类标准中,统一分类体系,来获取最终的场景分类图。该框架因场景类别映射为非监督性以及场景分类标准的可变性,而具有可扩展性,可以适用于不同的城市需求。