基于全文搜索引擎的大规模轨迹数据高效查询统计研究

来源 :长安大学 | 被引量 : 2次 | 上传用户:zdjige
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
轨迹数据是连续轨迹点的集合,轨迹点通常是具有时间和空间属性的空间点对象。在互联网、GPS定位等技术迅速发展的背景下,轨迹数据的种类、规模及其产生速度都在迅速增加。海量的轨迹数据必然蕴含了诸多有用的信息,通过不同的技术与方法对这些信息进行挖掘分析,对空间数据的研究与应用有着重要意义。数据的查询与统计是数据挖掘分析的必要条件,也是互联网产品日常使用过程中的基本需求;高效的数据查询与统计速度不仅能保障数据分析的时效性,而且有助于提升互联网产品的用户体验。本文基于Elasticsearch全文搜索引擎框架,以出租车轨迹数据为例,对空间轨迹数据的高效查询与统计分析做了深入研究。首先,剖析了传统关系型数据库与全文搜索引擎在大规模数据存储与检索上的优劣;其次,搭建了Elasticsearch集群服务并对其查询性能做了测试分析;再次,基于Geohash地理编码实现了WebGIS中大量点数据高效聚合展示的功能;最后,设计并开发了大规模轨迹数据高效查询统计系统,验证了将全文搜索引擎应用于轨迹数据高效检索的可行性。本研究主要取得如下成果:1)探索了出租车轨迹数据在Elasticsearch集群中的存储方案,搭建了用于存储出租车轨迹数据的Elasticsearch集群。经性能测试工具的模拟查询测试,该集群在高并发访问条件下具有高效的查询速度与可靠的稳定性。2)后台实现了起讫点数据高效动态聚合展示的相关算法,解决了传统前端WebGIS框架难以实现大规模点数据高效聚合的问题。该方法首先采用Geohash对二维空间进行网格划分,对出租车起讫点数据进行基于网格的聚类,然后将聚类结果再次进行基于密度的聚类得到最终聚合结果。经实例验证,该方法具有较好的动态聚合效率与效果。3)基于Elasticsearch集群服务与相关前端开发框架设计开发了用于大规模轨迹数据高效查询统计的可视化系统,系统支持空间查询、属性查询、聚合分析、热点区域分析等功能。从而实现了全文搜索引擎与WebGIS应用的结合。
其他文献
聚类是数据挖掘中颇为重要的技术,其功能是按照某种准则将数据划分成组。K-means算法是一种被广泛使用的聚类算法,本文主要对该算法做深入的分析和研究。K-means算法具有简单
目的研究妊娠期糖尿病(GDM)和妊娠期糖耐量受损(GIGT)对孕产妇和新生儿的影响。方法在产科住院待产孕妇中收集已经诊断为GDM 105例及GIGT的孕产妇共145例,并选取同期待产的血
<正>1引言我国矿山机械行业标准化工作起始于1960年。经过近60年的发展,已形成以全国矿山机械标准化技术委员会为基本活动单元的行业标准化工作体系,满足了行业技术发展、国
【正】《小说界》1994年第1期,发表《须兰小说六人谈》一文.吴俊指出:
期刊
针对当代大学生基本上都是在外求学,几乎大部分东西都不能很方便携带的现象,闲置用品网站平台就拥有了有利的市场推广背景。通过闲置用品网络平台,可以使广大的资源循环利用,
把社会主义核心价值体系融入国民教育、精神文明建设和党的建设全过程,不仅是一个目标,也是一种途径。以民族院校为基地,以思想政治教育为切入点,探索一种将社会主义核心体系
目的:探讨肌电生物反馈疗法联合神经肌肉电刺激(NMES)对脑卒中吞咽障碍患者吞咽功能及营养状况的影响。方法:60例脑卒中吞咽障碍患者随机分为常规组、NMES组、综合组各20例,
人们往往以“诗的国度”来赞誉和强调诗歌在中国古代文学中的重要地位,实际上,散文这种文学样式在中国古代文学中的地位一点也不亚于诗歌。较之诗歌而言,其产生时间更早,使用范围
目的了解不同职业者的经济收入与医药费用情况;有助于社会安定团结及提高人群生活质量.方法取某矿区工人及居民男性500人,随机抽样问卷填表式,用SPSS10.0软件包分析.结果问卷
研究了鳙鱼鱼片的脱腥调理和脆化工艺。比较了不同的脱腥剂对鱼片的脱腥效果,结果表明,以“2.0%红茶+0.75%NaCl”作为脱腥剂效果最好。在此基础上,采用正交试验优化了脱腥剂