论文部分内容阅读
随着信息技术的飞速发展和新需求的不断提出,空间数据的重要性日渐提高,应用领域日益广泛。由于采集时间、比例尺、采集人员和采集手段的不同,获取的空间数据在几何形状、精度、详略程度等方面都存在差异,为空间数据的融合与共享带来了很大的不便。同名实体匹配技术作为空间数据融合与共享的关键技术,目的是要建立多源地理数据库中同名实体之间的映射联系,实现对多源数据的综合利用。本文对同名实体匹配技术的相关理论和算法进行了研究,对同名实体的几何匹配、拓扑匹配和语义匹配进行了探讨,主要内容和成果如下:(1)对空间数据的基本概念、基本特征、差异性和相似性进行探讨,为同名实体匹配提供了理论依据:对同名实体匹配的定义、限定条件、技术流程以及匹配算法评价准则进行了研究。(2)从几何匹配、拓扑匹配、语义匹配三个方面对同名实体匹配方法进行研究,以空间数据的相似性度量为依据分别研究了点实体、线实体、面实体三种实体类型的匹配指标,主要包括长度、距离、面积、形状和方向五个方面,给出了适用于几何匹配的实体几何特征描述方法。(3)进一步对匹配过程中的相关策略和方法进行研究,主要包括:正反双向匹配策略,能够有效地解决了非一对一的匹配情况,提高匹配精度;综合相似度匹配方法,通过对各个实体类型的相似度指标进行同名实体匹配的应用条件和特点的分析,提出了适用于点实体、线实体和面实体的综合相似度匹配方法;候选匹配集优化方法,主要分析了基于缓冲区的候选匹配集优化方法和基于空间索引的候选匹配集优化方法,可以有效地排除不可能匹配的实体从而提高实体匹配的效率。(4)在Windows环境下,基于C#软件开发平台运用面向对象的方法和COMGIS(组件式GIS)技术,利用ArcGIS Engine 10组件进行地图的可视化显示和GIS常用功能的开发,搭建了一个同名实体匹配的试验系统,实现了数据预处理、同名点实体匹配、同名线实体匹配、同名离散面实体匹配和同名邻接面实体匹配等关键功能,对本文所提出的同名实体匹配方法和策略进行验证和分析。