基于集成学习的出租车预计到达时间预测

来源 :厦门大学 | 被引量 : 0次 | 上传用户:mobydick2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当下生活中,乘坐出租车,或通过打车软件打车已是很常见的一件事。如何给顾客提供好的乘车体验,即在顾客给出起点和终点时,要尽量让顾客等待最少的时间,使顾客能坐上车,以及安排最佳的行驶路径,并给比出较准确的预估时间,使顾客能尽快到达目的地,这是一个很好的研究方向。要达到这一点,关键技术之一就是要能预测出对于任意起始点,出租车需要的行驶时间。而做到这一点,也有利于出租车公司合理优化司机运力调度,减少不必要的资源浪费。一直以来,机器学习这门学科在许多领域都起着不可替代的作用,为人们的生活带来诸多便利。这是一个数字时代,人们每天都在产生大量数据。机器学习可以通过对这些数据集进行建模,获取到潜在的可利用的信息。并利用模型做出一些决策和预测。集成学习是机器学习的一个重要分支,也是数据挖掘领域常用的手段,在数据挖掘比赛中更是大放异彩。通过一定的策略,聚合若干个学习器,集成学习往往能得到一个更强的模型,这样的模型往往泛化能力都比较好。本文的主要研究内容包括:从NYC Taxi and Limousine Commission提供的纽约市出租车行驶的数据集中,做一些探索性的数据分析和可视化,进行数据预处理和特征提取,得到有效的特征。训练出若干个性能较好的基学习器,探索如何合理的选取基学习器,并使用集成学习的集成方法,对基学习器进行有效的模型融合,以达到一种强强联合的效果,使集成的模型对出租车的预计到达时间能做出一个比较精准的预测。
其他文献
围绕县级国土空间规划对自然资源与环境问题数据资料的获取与建库、资源环境承载力评价、国土空间开发适宜性评价、国土空间规划优化4个关键问题,以延安市延川县为研究区,提
目的:分析妇产科腹部手术切口感染及裂开的病因,探讨其预防对策。方法选取我院自2012年1月~2013年12月妇产科行腹部手术切口感染与裂开的患者32例,对其临床资料进行回顾性分析。
在进行妇产科手术的过程中,经常会在术后出现的一类问题就是切口感染,造成这一问题的原因是多方面的,例如病患具有较厚的皮下脂肪,身体的抵抗力较差,术后的恢复状态不佳等都
随着会计学的发展和人们对会计信息需求的日益增长,内部报告问题成为会计相关性理论研究和会计信息需求实践中亟待解决的问题。研究现状表明,内部报告理论与体系框架研究的不
基于元胞自动机对行人疏散流进行仿真研究.模型利用两个动态参数反映行人移动区域内的疏散情况,从而决定行人的行为选择.模型中行人可以根据自身周围的情况选择移动、等待行
随着城市的快速发展,人们对生活环境的要求也日益提高,城市慢行通廊的绿化景观设计体现一个城市的人文环境,反映一个城市的发展水平,越来越受到人们重视。本文介绍了常熟市慢
目的了解上海市徐汇区城市社区老年人跌倒发生和认知的情况,并探索不同预防跌倒干预策略的有效性。方法采用社区干预试验的方法,设1个对照组不施加与一般人群不同的措施,3个
本文报道取手足阳明经穴 ,佐以足少阳三焦经穴 ,揉运推拿治疗小儿先天性肌型斜颈14例 ,均在 2~ 3个月内获愈 ,通过 1~ 9年随访无一例留下后遗症 ,预后良好。
探讨固尔苏治疗早产儿肺透明膜病的疗效。把自2005年2月至2008年12月在莆田学院附属医院儿科住院的早产儿肺透明膜病的68例患儿随机分为两组,固尔苏治疗组30例,对照组38例,通
根据《国家中长期人才发展规划纲要(2010—2020年)》的总体要求,财政部在认真总结会计人才建设取得的成就和经验、深入分析当前和今后一个时期会计人才发展面临的新形势、新