论文部分内容阅读
通过现有的地表覆盖数据及信息服务平台,用户能够获取直观的空间分布与时空变化等信息,但对于其分布特征、地域规律、变化成因、发展趋势等用于辅助决策分析的其他专业领域知识,却很难获取。为了满足综合地学分析、防灾减灾、政府决策等重大需求,需要关联不同学科、不同专业和不同应用的多源知识,而地理空间语义异构是实现多源数据关联、精确发现潜在关联关系的主要瓶颈,如何构建关联模型是将非结构化的其他领域知识与地理空间知识关联到一起的关键技术问题。研究发现,传统的基于空间特征的多维关联模型、基于时间特征的时序关联模型以及基于尺度特征的多尺度关联模型都存在关系表达不完善,很难实现更广泛更深层的关联。针对以上问题,需要从地理实体的语义描述出发,挖掘出地理实体间存在的潜在关联关系,建立地理空间语义关联模型。在此基础上,又分析了三种最常见的基于关键字匹配的地理空间语义关联模型、基于RDF的地理空间语义关联模型和基于本体的地理空间语义关联模型存在的不足,并提出了RDF与本体相结合的基于Linked Data的地理空间语义关联模型。本文的主要研究工作和创新点如下:(1)提出了基于自定义词典的知识对象抽取方法。通过模型训练得到自定义词表,并追加测绘和地理科学两个领域词表,以急速词典法进行分词,提高了分词的精度和效率。(2)提出了基于Linked Data的地理空间语义关联模型。先是基于文本相似度计算自动化构建本体,通过训练空间向量模型,提取知识条目间存在的各种主题关系、空间关系及时间关系,通过类与关系构建GUK本体。再将本体与RDF结合,通过定义的GUK本体,生成相应的RDF,将数据库中的知识条目与关联数据中的类进行映射,完成传统数据向关联数据转换,进而实现语义搜索。实验结果表明,把Linked Data技术应用于构建语义关联模型,挖掘不同学科数据间潜在的关联关系,提高了搜索效率。(3)研制了城镇化知识原型系统。将已发布的GUK关联数据与地表覆盖数据相结合,在获取地表覆盖空间分布与时空变化等信息的同时,可得到部分城镇化专业领域知识,实现初步的应用,辅佐用户决策分析。