论文部分内容阅读
随着GIS应用的普及和不断深入,空间数据量日益庞大。由于应用目的和专业背景的不同以及本身结构的复杂性,这些空间数据在坐标投影方式、数据格式及数据的语义等方面都存在很大差异。为消除这些差异,实现多源空间数据的统一访问和使用,本文对多源矢量数据的集成进行了探索性研究。 通过对空间数据差异的分析,本文认为在数据集成时数据间的语义差异较难解决且相关研究不够深入,因此提出了一种顾及语义差异的多源矢量数据集成方法,通过模式映射技术对数据的语义进行转换以实现多源数据的抽取加载集成,并对集成结果进行冗余检测和处理。本文的研究工作主要体现在以下几方面: 1)针对矢量数据的特点,对其进行模式层次划分并讨论各层次模式元素的匹配方法和过程。用属性实例的统计信息验证模式元素间匹配的正确性,通过具体的语义转换规则实现模式映射的生成。讨论用XML对映射结果存储的优势,用XML片段对映射结果的存储形式进行描述。 2)在分析现有数据冗余消除方法的基础上,结合空间数据的特点,从几何图形和属性两方面对矢量数据的冗余进行检测,讨论了对应的算法并给出了算法的伪代码实现。对检测出的冗余记录讨论了自动和人工手动处理措施。 3)在上述数据集成理论和方法的基础上,利用.NET平台设计开发了多源矢量数据语义集成原型系统。用武汉市土地利用数据对本文所提方法进行了实验。