论文部分内容阅读
随着数字城市建设的推进及在线电子地图应用的普及,海量地名信息查找与检索已成为各类城市级GIS应用平台和在线电子地图平台的核心功能。地名信息检索也已成为相关研究领域的热点问题,并取得了丰富的研究成果,然而这些研究主要侧重于检索效率和文本关键词匹配质量的提高,并未顾及实际应用需求和地名信息检索现状的矛盾。目前,各类在线电子地图平台均以地名标识点或兴趣点为检索对象,以文本关键词的匹配为检索方法来获取地名,忽视了地名的空间信息,也难以实现复杂的检索请求,而解决这些问题的关键在于检索数据与检索方法的共同改进。近年来,以天地图为代表的在线电子地图平台开始关注地理实体数据,但是并未提出将该数据应用于地名信息检索。地理实体与地名具有天然的密切联系,这种联系为检索数据的丰富和检索方法的发展提供了契机和条件。因此,本文通过融合地理实体和地名来研究基于属性特征和空间特征的地名信息检索形式和方法。本文主要的研究内容及成果如下:(1)分析了地理实体和地名的概念模型、数据特征和关联关系,以此为基础来分析地理实体对在线电子地图地名检索应用的影响,从而提出顾及地理实体的地名信息检索模式,并实现对其的结构化表达。在该检索模式中将地理实体的属性特征和空间关系作为检索特征项,为检索模型和方法的研究提供基础。(2)依托顾及地理实体的地名信息检索模式,借鉴向量空间模型和地理信息检索模型,提出基于地理实体相似度计算的地名信息检索模型(Place Name Information Retrieval Based on Geographic Entity Similarity,GS_PNIR)。通过研究模型中检索对象的属性特征及空间关系的类型划分,提出与之对应的属性相似度计算方法和空间关系相似度计算方法。该模型同时适用于基于属性特征的地名信息检索和基于空间关系的地名信息检索。(3)基于GS_PNIR和Lucene构建了地名信息检索框架。利用Lucene Spatial实现地名综合索引的构建,使文本索引与空间索引以一体化的方式进行组织和管理。利用GS_PNIR模型来改进Lucene的相似度计算模型,并以此为基础设计了地名信息检索和排序算法。通过实验来验证本文所提出的检索方法的可行性和有效性,实验结果表明,该检索方法不仅能够实现基于属性特征和空间关系的地名信息检索,也能有效改进检索结果的准确度和排序结果的优良性。