论文部分内容阅读
随着计算机网络技术和地理信息技术的迅猛发展,地理信息数据作为一种重要的基础信息数据资源,使其不仅在城市规划、交通导航、灾害监测、国防军事等国家建设领域得到了广泛的运用,而且,与人们的日常生活联系的也越来越紧密。特别是Google向公众推出了基于空间位置服务(Location Based Services, LBS)用户体验之后,给人们的工作和生活带来了很大的便利。地理信息数据在促进国家经济社会发展,给人们日常生活和工作带来很大便利的同时,同样也有一些亟待解决的问题。其中比较突出的是地理信息获取问题,传统的地理信息获取主要通过实地测绘和遥感等手段,这些方法都存在着成本高、精度低、无法实时更新等弊端。同时,网络地理空间的虚拟性、共享性、无国界性等特点,特别是现在网络中散布着很多地理信息数据,这都为地理信息获取提出了一种新的途径和来源,研究如何从网络中获取地理信息数据具有重要意义。本文主要研究了从网络中获取地理信息数据的关键技术。分别针对文本、栅格等不同类型的地理信息数据提出了不同的获取方法。对于文本地理信息数据获取技术,主要通过网络爬虫(Web Crawler)技术来获取,本文重点研究了多种网络爬虫算法,将基于内容的Shark Search算法和基于链接的HITS算法相结合,提出一种新的网络爬虫算法,即SS-HITS算法,该算法不但可以减少基于内容算法的局部性问题和基于链接算法的主题漂移现象,而且提高了网络爬虫的页面回调率、查准率和主题相关度。对于栅格地理信息数据获取技术,本文主要通过分析其投影方式、数据组织和管理模型等关键技术,提出了一种栅格地理信息获取方案,通过该方案可以获取全球范围高精度的栅格地理信息数据;另外,本文还提出了一种地图拼接、漫游和缩放算法,该算法不仅可以将获取到的栅格地理信息数据拼接成完整的影像地图,而且拼接后的地图还支持地图漫游和地图缩放功能。