路网空间移动对象数据库技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xixiyibobo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
道路网络(Road Networks)是人与机动车等移动对象日常活动的主要空间范围。移动定位技术、移动通讯技术、高性能计算与存储技术的飞速发展及移动终端的迅速普及,使得有效记录与分析这些海量移动对象在路网空间中的运行轨迹及其对象间动态变化的语义关系成为可能。现代城市中海量移动对象位置、轨迹及其相互间语义关系作为一种典型的时空“大数据”(Big Data),具有重要的研究价值,能够为基于位置的服务(Location-Based Services)、交通管理、城市规划、人口流动监测、公共安全保障、社会计算等提供珍贵的数据源。然而,移动对象位置与轨迹数据量超大,位置更新频繁、且可能同时附加大量的非结构化信息及高动态的非空间语义信息(如基于位置的社交网络用户之间的关系信息等),对传统的数据存储与管理技术提出了新的挑战。路网空间移动对象管理是移动对象数据库领域(Moving Object Database,MOD)的一个重要研究分支,也是业界关注的研究热点,旨在管理路网空间中的海量移动对象,并支持移动对象复杂时空查询。该研究领域虽经过多年发展,但仍处于起步阶段,远远落后于传统关系数据库的发展,距离位置服务等应用的要求还存在相当大的距离。同移动对象数据库的另一个研究分支自由空间移动对象管理技术相比,该领域研究成果也略显单薄与不足。  目前,路网空间移动对象管理在理论研究与技术实现方面都存在一些薄弱环节。在理论研究方面,路网空间下移动对象数据表达需要同时兼顾空间路网、移动对象轨迹及动态变化的非空间属性等三方面的信息,目前大部分时空数据模型均无法胜任这一任务。此外,由于路网空间下移动对象查询具有时间维与空间维两个维度,造成查询异常复杂,现有的结构化查询语言(SQL)也无法有效支持种类繁多的移动对象查询要求。与自由空间下移动对象索引相比,路网空间下的移动对象索引也存在很大的差异,主要原因在于路网空间下除了需要对移动对象的位置和轨迹进行索引,还需要对空间路网本身进行索引,必须引入组合索引机制。在技术实现方面,目前业界还缺乏有效的海量轨迹数据分析处理技术。传统的数据库分库分表、读写分离、缓存服务以及负载均衡等手段并不能够有效解决海量轨迹数据的处理问题。尤其是在海量数据环境下,传统的单机处理算法,如地图匹配算法、轨迹插值算法等,可用性均大打折扣,需要在分布式环境下重新设计相关的轨迹数据处理算法。此外,现有的传统数据库管理系统都没有充分利用计算机软硬件发展的新机遇,如大内存、高并发等,而且传统的数据库管理系统因为过于强调在事务控制方面的能力,而牺牲了数据处理的效率。海量移动对象轨迹数据管理需要弱化事务处理,支持高效的轨迹数据处理与数据挖掘,才能够有效发挥大数据的潜在价值。  针对目前路网空间移动对象管理技术存在的问题与不足,本论文立足于路网空间移动对象管理的已有的研究成果,依托关系数据库与移动对象数据库、分布式与集群计算、地理信息系统等领域相关技术,针对海量移动对象位置与轨迹数据管理面临的巨大挑战,开展路网空间移动对象管理的相关研究。本文主要研究工作与创新点包括:  (1)针对移动对象位置、轨迹及其移动对象间可能存在的语义关系的一体化建模需求,提出了一种有效的路网空间移动对象数据模型——GSM,该模型可以实现空间路网、移动对象轨迹及移动对象之间语义关系的时空一体化建模。并构建了GSM模型数据类型及相关的操作集合,包括基本操作、空间操作、语义操作及轨迹操作等。给出了该模型在图数据库与传统关系数据库中两种不同的实现方式,通过真实的导航路网数据与出租车轨迹数据,实验验证了本模型的可行性与效率,实验结果表明图数据存储引擎在该模型的实现过程中更加高效。  (2)在所提出的路网空间移动对象数据模型基础上,提出了一种路网空间移动对象全时态混合索引结构——MGNEI。传统路网空间索引采用分层索引,上层索引路网路段信息,下层索引每一条路段都关联一个单独的索引结构,造成索引数目众多,索引森林问题严重。造成该问题的主要原因在于路网与移动对象分开建模索引,因此本文所提MGENI索引以GSM时空一体化模型为基础,实现路网与移动对象的无差别存储,可以有效避免了传统的路网空间移动对象分层索引普遍存在的索引森林问题。接着提出了该索引结构的批量装载、插入等更新算法。此外还提出了该索引结构的范围查询处理与时间窗口查询处理过程。  (3)在MGNEI索引结构基础上,发展了路网空间移动对象最邻近查询算法族,包括快照式KNN查询、动态KNN查询及连续KNN查询实现算法。该近邻查询算法族首先改进传统的查询扩张树结构,并利用改进后的查询扩张树结构维持最近邻结果集的变化,避免连续查询过程中近邻算法的多次执行,提高算法效率。最后利用真实数据,分析了不同近邻查询算法效率,实验结果表明,改进后的查询扩张树放宽了原有扩展树结构的限制,降低了扩张树维护成本,提高了算法的稳定性。  (4)针对海量移动对象轨迹数据处理的效率问题,基于云计算、NoSQL等相关技术,构建了一个分布式环境下海量移动对象处理分析平台TrajectoryCloud。并给出了高并发数据存储与管理方法,及基于MapReduce的处理分析算法,为海量移动对象数据处理提供了一个可靠的解决方案。  
其他文献
1994年底,党中央、国务院调整了鞍钢的领导班子,江泽民总书记、李鹏委员长、朱镕基总理等中央领导先后到鞍钢视察,对鞍钢如何走出困境、实现振兴作出了明确的重要指示。五年来,鞍钢遵
本研究选择宁夏平原的一种重度盐碱化土壤——龟裂碱土为研究对象,该土壤是一种碱化度高、结构极差的碱化土壤,在中国西北地区有大面积的分布。研究区内0-40cm土壤平均SAR为38.
大写意是对写意的提升,而一切花色鸟姿皆是人情心韵。初见高士尊,满头白发,一件盘扣复古棉袄,鹤发童颜、高大沉稳。数十年苦心孤诣研究一纸丹青的他,慈祥的笑容下掩映着一颗
随着我国酒店行业的发展和行业竞争的日趋激烈,酒店服务的个性化和差异化趋势日益凸显起来,充分利用员工绩效管理体系来调动酒店员工的工作积极性,成为了酒店实现科学化管理
大地震给四川带来严重的损失,为了挽回损失,重建灾区经济,有学者提出利用地震遗址发展黑色旅游的建议,引起社会的广泛争议。反对者认为这种靠已经去世的人发财,是对逝者的不
新一代天气雷达是一种新的天气观测手段,其产生的反射率数据可用于降雨估算与预报,从数据中挖掘更多的降雨信息并开发相关软件系统是当今研究的热点。  本文将地学可视化分析
一年一度,又到了全省党史研究室主任研究一年工作的时候。今年是世纪交替之年,明年又是中国共产党成立80周年,都是党史工作的“大年”,是大家的“用武之地”和“有为之年”
湿地生态系统固碳潜力是全球碳循环研究的重要内容,然而对河口湿地的固碳潜力因素仍缺乏共识,对不同因素潜力大小缺乏定量的评估。因此,研究河口湿地净初级生产力形成过程及影响
(清)王夫之说:“文以意为先,意犹帅也;无帅之兵,谓之乌合。”什么是立意?立意,就是针对客观事物或问题,直接提出自己的见解或主张,阐明理由,表明自己的态度。作文的立意,就是
期刊
生态系统服务对于人类生计的影响非常重要,然而由于两者的关系很难被定量评估,因此已有的研究成果较少。本论文对于生态系统服务是否对于承德市丰宁县的农户贫困状况有影响进