基于交通大数据分析的出租车载客智能推荐技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:qiuenqiuen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能城市中每天都会产生大量的数据,而从海量的数据中挖掘出有价值的信息来提高人们的生活水平成为现在的研究热门。随着大数据技术的迅猛发展,使得对海量数据进行分布式存储和分析成为可能。同时,配有GPS定位系统的出租车每时每刻都产生大量的轨迹数据,这些数据包含出租车编号、纬度、经度、时间、载客状态等基本信息,分析这些轨迹数据以实现智能出行成为当务之急。针对城市中出租车花费大量时间寻找乘客,而乘客也需要耗费大量时间等待出租车这一不平衡的现象,本文从为空驶的出租车推荐最佳寻找乘客策略的角度入手,利用大数据处理平台Hadoop和Spark对北京市出租车历史轨迹进行存储和挖掘,并结合出租车的实时信息和历史轨迹数据提出载客热点区域的推荐策略,为出租车司机提供最佳寻客方案。本文提出HRHT推荐策略为出租车司机提供寻客方向,该策略分为两个阶段:载客量预测阶段和出租车载客热点推荐阶段。在载客量预测过程中,首先通过对载客量的分析发现,即使在不同日期的同一时间段内的载客人数也大不相同,而且每天的载客人数按照周期为7天的方式变化,因此本文提出载客量的预测模型 PVHH(Predict Volume of Passengers based on Historical Hotspot),PVHH模型通过对热点的历史载客量进行统计,得到城市中不同时间段的乘客分布。进一步基于改进的决策树IDT(Improved Decision Tree)分类算法训练载客量预测模型,从而实现热点载客量的预测。IDT算法通过分析不同时间段的载客量对预测时间段载客量的影响程度,对PVHH模型中的载客分布数据进行加权,使用自适应Boosting方法训练预测模型。最后通过载客流量预测的结果选取历史数据中具有相似载客量的时空Index。在出租车载客热点推荐过程中,本文提出出租车载客热点推荐策略HRHT(Hotspot Recommendation based on Historical Trajectory),HRHT 通过对出租车寻客事件和载客事件进行统计,得到每个热点的寻客效率及载客热点间的驾驶时间,并通过载客量预测阶段返回的时空Index,动态的选取寻客效率和热点间的驾驶时间统计结果,进而通过HRHT推荐策略对选取的结果进行分析,为司机推荐最佳载客热点。最后使用北京市出租车历史轨迹数据对本文的提出的预测算法及推荐策略进行验证,实验结果表明,IDT算法与对比算法K-临近算法和支持向量机算法相比较,具有较高的预测准确度和预测效率,更适合实际场景下的应用。而且HRHT推荐策略能够准确的筛选出最佳的载客热点,为出租车节省寻客时间,推动智慧城市的发展。
其他文献
我们通过感知视觉、听觉、触觉等信息以及它们的组合来认识外部世界。而面对这些纷杂的信息时,只有我们的大脑对这些信息做出正确的编码,才能高效和正确的做出反应。为了对外
游客中心是随着旅游业的发展走进人们视野。游客中心具有服务、引导、展示等功能,是旅游景区的一张名片,也是主题公园对外展示的重要窗口,它能在第一时间吸引人们的关注。游客中心的形象应体现出主题公园的特色,让游客能自发性产生对游客中心的好感,进而对主题公园产生良好的印象。文章从不同类型的主题公园为切入点展开研究,寻求游客中心与周围环境之间的关联性,使游客中心与所在环境形成一种有机的联系。文章阐述了主题公园
项目管理的核心是进度管理,而进度管理的主要内容是进度计划与控制,项目成败的关键在于以项目执行、跟踪和控制为基础,制定合理的项目进度计划。银行系统项目开发中传统的方
摘要:在数论中,不定方程的解和函数的均值问题占有非常重要的地位.国内外众多数学学者对此进行了深入的研究,并取得许多卓越的成绩.基于此,本文采用初等数论和解析数论中的相
伪Smarandache函数与Euler函数在数论领域中有着举足轻重的地位,许多数论学者对此进行了深入的研究,并提出了有价值的研究问题,激发着人们不断去探究的兴趣.本文基于对伪Smar
摘要:Smarandache函数是数论研究的重要内容之一,随着人们对它的深入探索和研究,目前已经出现了很多类函数方程和研究方法.本文在阅读大量与Smarandache问题相关的书籍和文献
非线性算子的不动点理论是非线性泛函分析研究的重点内容之一.本文的重点内容是构造了新的迭代算法,分别用于逼近变分不等式的解,一族拟?-非扩张映像的公共不动点集与一族极
在一定条件下,本文给出四元数值连续函数空间上等距算子的表示以及由四元数值连续函数空间到四元数拟Banach空间上穷举算子的积分表示,同时刻画了四元数值函数空间L~1上有界
(?)设计作为一种特殊的有限关联结构,不仅具有部分几何设计的全部性质,并且与强正则图、部分平衡不完全区组设计都有密切联系。此外,利用(?)设计中的反旗还可以构造有向强正
创新是引领发展的第一动力,在国家发展全局中处于核心位置。然而知识和技术的发展使得单从区域内部获取创新资源已难以为继,因此催生了合作创新模式。进一步,区域间的合作创