基于云计算的出租车轨迹数据挖掘研究

被引量 : 0次 | 上传用户:chyfandy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的飞速发展,互联网技术的广泛应用,各行各业的数据量都在急剧增长。如何对这些海量的数据进行分析,转化成易理解并有用的知识,成为目前各行各业面临的重要问题。问题的研究促使了数据挖掘技术的产生,它正是从大量数据中获取有价值的、可理解的知识。目前,数据挖掘技术已经被广泛应用到了各个领域中。聚类分析技术是数据挖掘技术的一个重要组成部分,其中基于密度的DBSCAN算法可以从含有噪声的空间数据集中挖掘出任意形状的类簇,在空间数据挖掘领域得到了广泛应用。云计算技术的出现解决了数据挖掘中海量数据的存储和计算。云计算技术将存储和计算能力分布到由多个存储和计算节点组成的集群中,实现了超大数据集的存储和计算。凭借着云计算技术提供的强大存储和计算能力,数据挖掘技术进入了基于云计算的飞速发展时期。城市中的出租车是城市动态性的一种体现,随着无线通信技术的高速发展使得出租车的轨迹记录变得方便快捷。国内出租车大都已经配备了GPS终端,每天会产生大量的轨迹数据,如何从海量轨迹数据中获取对乘客和出租车司机有用的信息已成为研究的热点。首先,本文介绍了云计算技术,分析研究了云计算平台Hadoop下的HDFS分布式文件系统及MapReduce编程模型。在了解了聚类算法并重点深入学习基于密度的DBSCAN算法后,结合MapReduce编程模型,设计了并行化的轨迹聚类算法,然后在Hadoop平台上实现,并在自己搭建的Hadoop平台上进行了时效性验证。然后,在学习和研究了数据挖掘系统相关知识,阅读出租车轨迹挖掘相关资料后,提出了一个基于云计算的出租车轨迹数据挖掘平台,将海量的出租车数据进行分布式存储,提供基于云计算的算法集进行数据挖掘。分别从出租车司机、乘客以及政府的角度出发,分析了挖掘出租车轨迹数据可能为现代城市带来的各类智能服务。最后,通过挖掘大规模出租车轨迹数据,提出出租车载客点推荐应用为出租车司机提供服务。通过对海量轨迹数据进行离线数据挖掘并实现分特征时间段存储,在给定需要服务的出租车司机的地理位置和当前时间后,为其推荐周围的载客热点,帮助其快速找到载客点并最大化收益。基于深圳市13798辆出租车的历史轨迹数据,通过实验对推荐应用进行了相关论证,实现结果表明了推荐应用设计的合理性及实践的可性行。
其他文献
随着教育新课程改革的推进和素质教育的发展,学校和班级管理过程中以"学生为本"的思想越来越受到重视,特别是班级内"学生自主管理"的模式越来越受到我们推崇,那如何让学生在班级
<正> 太原市在创造性地开展公务员录用工作的过程中,努力打造政府新形象,不折不扣地贯彻“公平、平等、竞争、择优”原则,完善国家公务员考录管理机制,在录用工作各个环节全
会议
抗生素被长期大量应用于人和动物的疾病治疗,并以亚治疗剂量添加于动物饲料长期用于动物疾病的预防和促进生长。但是,抗生素滥用所导致的耐药性后果已经成为影响公众健康的公
目的探讨急性一氧化碳中毒急诊救治经验。方法回顾性分析36例急性一氧化碳中毒患者急诊救治资料,总结其急诊救治经验。结果36例均行高压氧治疗,全部患者成功救治,无一例患者由于
在编制阿勒泰市国土空间规划前,先编制完成市辖区范围内的空间发展战略规划,可以有效地指导下一步国土空间规划的编制工作.
在世界各国的利率市场化进程中,大多伴随着中小商业银行风险加剧,甚至大量破产,对中小商业银行造成了极大冲击,因此中小商业银行能否管理好利率风险成为关注的焦点。本文对我
在现代科学技术发展的不断推动下,学校教育教学中陆续出现了新的技术、新设备仪器、新的教学方法、新教学手段、新课标、新课改等等,随之教育技术越来越多,教师的教学方法也
研究了早中熟白肉蟠桃‘沪蟠1号'和黄肉圆桃‘锦香'果实发育中后期的果形和色泽变化。结果表明:‘沪蟠1号'的果形变化较小,‘锦香'逐步从椭圆形变为近圆形;‘沪蟠1号'和‘锦香'红果
作为金属切削过程的执行者,刀具在工件的切削过程中必然存在磨损和破损现象。刀具磨损状态的变化将直接影响工件质量并导致生产成本增加,从而降低产品的竞争力。因此,实时监测刀
本文通过对全球气候变化原因以及对人类的影响的分析,提出了改善气候变化的几种措施。