基于空间位置信息的多源POI数据融合问题的研究

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:zqqzqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着网络电子地图与基于位置服务(LBS)的快速发展,以POI为代表的空间地理数据出现了快速增长。POI是兴趣点(Point of interest)的缩写,是一种代表真实地理实体的点状数据,POI一般包含名称、类别、经纬度以及地址等基本信息。一方面,POI信息的搜集、存储以及更新需要花费大量的人力、物力,并且POI信息的及时添加和更新服务已经成为各个网络地图的核心竞争力;另一方面,不同来源的POI信息完善和丰富程度各有不同。如何把来源不同的POI信息进行集成融合从而实现数据复用,已成为急需解决的问题。POI数据融合技术是解决地理空间数据复用的关键技术,本文所提到的POI数据融合技术最终目标是:将两个POI数据集合中表示同一个地理实体的POI对象标识出来,并将它们放在“融合集”中。国外研究者提出的解决方案有大致如下:基于Ontology的技术;基于空间位置的技术;基于非空间属性的技术。为从两个来源不同的POI数据集合中准确找出用于融合的对应对象,本文在国外研究成果的基础上提出一种改进方案,该方案在空间位置属性的基础上利用非空间属性相似度来提高结果融合集的准确性。本文的具体研究工作与研究成果如下:首先,对两个不同来源的POI数据集合实施空间位置技术找出对应对象组成的初步融合集,基于位置方法的优点是它仅仅根据经纬度位置信息就可以找对应对象,而经纬度信息是每个POI都必须具备的,不存在数据缺失问题;缺点是来源不同的POI的经纬度都普遍存在误差与坐标系不统一的问题。其次,使用低阈值的名称属性相似度算法排除由空间位置方法找出的错误对应对象。该算法的优点是它只使用非空间特征属性而不用考虑经纬度中存在的差异,方法也更为成熟,缺点是它要求不同来源的POI之间必须有比较统一的存储模式,另外,非空间特征属性有可能存在信息缺失与标注错误问题。此外,在此步骤中使用低阈值的名称属性相似度算法的原因是:空间位置相近的POI对象有相似的名称。第三,使用高阈值的名称属性相似度算法找出空间位置方法未能找出的对应对象。这里之所以使用高阈值的名称相似度算法,是因为二次过滤的POI数据没有空间位置的约束。最后,用多组POI数据集合测试改进方案,实验结果表明融合集的准确率、召回率以及F1值都有明显提高。
其他文献
通过对生物智能机理的借鉴,许多解决复杂问题的新方法不断涌现。最近,Yang基于蝙蝠的回声定位行为,提出了一种新的全局优化算法——蝙蝠算法,同时将一些现有算法的优点引入到
本文概述了高速铁路的建设情况,同时也介绍了我国高速列车车辆的关键技术包括轻量化和车体材料等。全面分析了200km/h高速客车车体的结构特点,阐述了该车车体钢结构轻量化设计的
本课题运用自制的改性层状硅酸盐,通过挤出插层复合法与橡胶进行复合,制备了多种橡胶/层状硅酸盐纳米复合材料,并深入探讨了纳米复合材料的配方及制备工艺、亚微观形态和性能之
本文利用1998~2006年中国30个省市的面板数据,对FDI对制造业工资收入差距的影响进行了实证分析。研究发现,FDI有利于缩小我国制造业行业间工资收入差距;FDI缩小制造业行业间工
第一部分 血浆中马兜铃酸的HPLC法建立及关木通中马兜铃酸的药代动力学研究2000年5月16日美国食品和药品管理局(FDA)公布了“FDA对产业界的有关含有马兜铃酸植物药物和食品的通
新制订的《英语课程标准》将“开发课程资源,拓展学用渠道”确定为基础教育阶段英语课程的基本理念之一,以改变我国基础教育阶段英语教学“少、慢、差、费”的被动局面。如何在
目的观察帕罗西汀联合微生态制剂对伴有功能性消化不良症状的焦虑障碍患者临床疗效。方法选取伴有功能性消化不良症状的焦虑障碍患者128例,随机分成两组,每组64例:单用组给予
本文通过对《保险法(修订草案)》关于投资不动产一项修订的解读,研究了目前我国保险资金的配置状况,引用最新数据对比讨论了放开不动产投资限制后,保险资金可能获得的收益与