HBase时空索引设计及在交通车辆邻近查询中的应用

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:yangpingliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,打车软件日益盛行,行车记录仪的普遍化,为了能快速响应用户的打车需求,也为了能获取行车记录信息协助案件侦破,交通车辆的邻近查询成为解决上述需求的关键。交通车辆的邻近查询可描述为在海量交通数据下,求在时间段T内某一区域内车辆或距地点A最近的N辆车的查询问题,由于交通数据的海量性和时空性,可将问题进一步抽象为海量时空数据下的时空检索问题。针对时空检索问题目前提出的解决方法,大多使用R树、K-d树或四叉树和倒排表相结合的混合索引结构对时空对象进行索引,以此为时空查询提供支持。然而上述索引方案大多基于关系型数据库,如Mysql、Oracle等,而传统的关系型数据库无法有效地对海量数据进行管理,并且内存式索引结构在数据量较大的情况下将会发生频繁的磁盘读写,大大降低了索引的性能。为了解决海量时空数据的检索问题,需要有一套完备的时空数据存储和处理机制。  本文在大量调研工作的基础上,鉴于HBase在大数据管理方面的优良表现,提出了HBase的时空索引设计方案,并将其应用于交通车辆的邻近查询中。本文的主要创新点如下:  1.利用开源的Geohash创建HBase的空间索引,并设计“构建最优Geohash前缀检索集合”算法,提高空间检索效率。  2.汲取多个方案的失败经验,借鉴Geohash的降维思想,在已有的HBase空间索引的基础上,将时间打散并与时空对象的空间描述的Geohash编码再次进行交叉编码,平衡时间和空间在时空查询中的权重,构建HBase一维时空索引,并给出详细的构建步骤。  3.本文设计的HBase时空索引只是数据层面的变换,并未对HBase系统做任何的修改,实现了对原系统的零侵入性。  4.基于HBase时空索引,与实际问题相结合,设计了“基于HBase时空索引的范围邻近车辆查找算法”和“基于HBase时空索引的K近邻车辆查找算法”,并进行实际地系统研发,解决交通车辆的邻近查询问题。  通过实验证实,在数据规模较大的情况下该方案具有较高的查询效率,在海量时空数据的邻近查询上具有一定的应用价值。
其他文献
该文着重研究了XML的索引结构,并对XML数据库的存取提出了自己的观点.该文通过研究Cooper等人提出的用于XML的索引结构Index Fabric,将B+树、散列结构运用于XML中,并充分利用
IGP(内部网关协议)是在同一自(治网络)AS内的网关间交换路由信息的协议,IPv6环境下OSPFv3协议是目前最流行的IGP协议。随着OSPFv3网络规模的扩大,对OSPFv3网络的管理、规划愈加复
虚拟私有网络VPN(Virtual Private Network)是近年来兴起的网络热门技术。拥有众多下级单位的政府部门和在全国各地开设了多家分支机构的大型企业都要通过WAN来联接分散的下
云计算技术是近年兴起的一项较为热门的技术,它利用互联网将地理上广泛分布的资源连成一个虚拟计算资源池,为用户提供一体化的应用服务。通过云计算技术可以充分利用网络上的
该文以系统集成为手段,深入研究了并行存储系统的集成技术,主要包括:硬件集成方法;系统开发平台选择原则;I/O调度策略;系统容错与修复;异构接口协议转换.在继承前人工作的基
该文首先介绍了开关磁阻电动机基本结构和控制原理,重点阐述了开关磁阻电动机直接转矩模糊控制系统模型的基本原理及其组成.其次,该文设计了采用DSP实现的开关磁阻电动机控制
针对传统防火墙中访问规则被滥用而遭到拒绝服务攻击的缺陷,提出并设计了基于访控资源的防火墙ARB-FW.防火墙为网络提供访问控制的安全服务.访问控制的原理及其在防火墙中的
论文首先对ad hoc及网络路由协议进行了综述.介绍了网络路由协议的分类以及ad hoc网络的一些专用路由协议,着重讲解了ad hoc网络中具有相对较优性能的DSR路由协议的机制.同时
“web代理服务器的研究与实现”是信息产业部“电子发展基金”支持的“网络专用服务器”项目下的一个子课题。当前Internet在迅猛发展,但网络带宽的增加与信息量和使用群体的
该文根据国内外已有的研究成果及应用情况,系统地研究了基于角色和任务的安全模型,在此基础上提出了一种授权语言FEAL,并详细讨论了访问控制中任务的影响,为应用程序开发人员