基于K近邻查询的出租车供应量评估方法

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:hustmjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:随着滴滴、Uber等打车软件的兴起,对于出租车供应量的评估需求也越来越大。出租车的供应量评估综合是考虑不同地区的可用出租车数量和出租车需求,得到整体出租车供应量的分布作为车辆调度的依据,达到提高服务质量的目的。本文定义了出租车/乘客密度的计算公式以及供应量的计算公式,并将它们应用在上海市的路网数据和真实出租车轨迹数据集上,分别求得各个区域可用出租车的密度和乘客的密度,然后得出上海市整体的出租车供应量情况。实验证明了该方法的有效性。
  关键词: 路网; 出租车; K近邻查询; 评估方法; 大数据
  中图分类号:TP931 文献标识码:A 文章编号:1009-3044(2018)07-0231-03
  Abstract: The demand of taxi supply evaluation increases with the rapid development of location based services like Uber. For the purpose of increasing service quality, taxi supply evaluation should take the amount of taxi available and the needs of the passengers both into account, and calculate the distribution of taxi supply as the basis of vehicle scheduling. In this paper, the density formula of taxis/passengers and supply evaluation formula are proposed. We apply these formulas to the road networks of Shanghai and the real track of taxi datasets, and prove the effectiveness of our method by experiment.
  Key words: road networks; taxi; k nearest neighbor query; evaluation; big data
  1 引言
  近年来滴滴、Uber等新兴交通方式发展迅猛,在人们的日常生活中扮演着越来越重要的角色,如何调度路网上大量出租车则成为了影响整体服务质量的一个关键点。要评估一个区域出租车的供应量首先要考虑该区域内空闲出租车的数量以及潜在乘客的数量,可用的方法包括基于欧式距离的K近邻查询或者基于路网距离的K近鄰查询等,接着以此计算出出租车和乘客的密度,最终计算出出租车供应量的区域分布。后文提供了使用K近邻查询结果计算出租车或乘客密度的公式,以及使用两个密度计算出租车供应量的公式,并通过实验验证了评估的效果。
  2 供应量评估方法
  2.1 密度计算公式
  密度反映的是移动目标在查询点周边的分布情况,假设查询点X在某一时刻kNN的查询结果为[cj1,cj2,…,cjk], 每一个查询结果对应路网距离的列表为[disj1,disj2,…,disjk],那么定义查询点在当前时刻的密度为DK=k = k /
  2.2 供应量计算公式
  假设查询点X在当前时刻周围空闲出租车的密度为Dcar, 潜在乘客的密度为Dpassenger,那么定义查询点X当前时刻的出租车供应量为F(k)=Dcar - Dpassenger = k×( 1 / - 1 /)。其中disjk为第k辆可用出租车的距离,disik为第k个潜在乘客的距离。
  2.3 实验
  对于每一个不同的K值,我们都可以计算出一个不一样的供应量分布。我们可以根据实际的调度需求来调整K值的选择,如选择供应量方差最大的K值以使得整体供应量的差异最大。后文实验选择K为275得到以下结果。
  2.3.1 出租车密度
  上图为上海市晚高峰时段出租车的密度分布,可以看出上海市中心沿黄浦江区域的可用出租车分布较为密集,而其余区域可用出租车分布较少。
  2.3.2 乘客密度
  以乘客的需求为负值,计算得上海市晚高峰乘客密度分布如图2。由图可知,晚高峰时段上海市乘客需求最大的区域仍以市中心为主,但深颜色区域较之图1要更大,因此乘客的区域分布更广。
  2.3.3 供应量分布
  根据我们2.2节的公式可以计算得出上海市晚高峰时段出租车的供应量分布如图3.可以明显看出上海市中心区域颜色整体偏蓝,属于供不应求区域,而外围颜色鲜亮,属于供过于求区域。此时可以考虑将周边区域的出租车调往市中心区域以缓解整体的乘车压力。
  3 结论与展望
  本文用K近邻查询结果定义了出租车和乘客的密度计算公式,以及出租车供应量计算公式。并通过实验验证了该评估公式在上海市路网和出租车轨迹数据集上可以直观地看出出租车供应量的分布情况,从而为系统管理员调度出租车辆提供依据。待完善之处包括:1) 评估的效果根据检查点在地图上分布的疏密差别很大,如果检查点数量较少,那么只能得到较为初略的评估结果,如果查询点数量较大,则会带来较大计算量,因此在查询算法上可以据此做出相应优化以适应大量查询点同时查询;2)依据不同的K值可以得到不同的评估结果,因此选择一个合适的K值非常重要,后续可以根据不同的评估需求,比较不同K值得评估结果,以此选择一个最优的K值。   參考文献:
  [1] Papadias D, Zhang J, Mamoulis N, et al. Query processing in spatial network databases[C]//Proceedings of the 29th international conference on Very large data bases-Volume 29. VLDB Endowment, 2003: 802-813.
  [2] Samet H, Sankaranarayanan J, Alborzi H. Scalable network distance browsing in spatial databases[C]//Proceedings of the 2008 ACM SIGMOD international conference on Management of data. ACM, 2008: 43-54.
  [3] Lee K C K, Lee W C, Zheng B. Fast object search on road networks[C]//Proceedings of the 12th International Conference on Extending Database Technology: Advances in Database Technology. ACM, 2009: 1018-1029.
  [4] Huang W, Li G, Tan K L, et al. Efficient safe-region construction for moving top-k spatial keyword queries[C]//Proceedings of the 21st ACM international conference on Information and knowledge management. ACM, 2012: 932-941.
  [5] Zhong R, Li G, Tan K L, et al. G-tree: An efficient index for knn search on road networks[C]//Proceedings of the 22nd ACM international conference on Information
其他文献
南粤广东又称岭南,曾有三次引发举国上下的高度关注,在社会发展史上留下了显赫的印记.回首千年,南粤是海上丝绸之路的起点;回首百年,广东是民主革命的策源地;回首二十年,岭南
支持向量机(Support Vector Machine,SVM)是一种高效的机器学习分类算法,针对手写数字识别问题,首先介绍了基于SVM的手写数字识别算法,详细阐述了相关核函数并分析SVM核函数
0前言与我接触的同事和朋友常常抱怨说,乔迁新居后很难物色到陶瓷雕塑作品,除非你愿意供上一尊瓷观音和瓷财神.陶瓷艺术品市场、历届的艺术博览会,能让参观者青睐的陶瓷雕塑
江南一隅、太湖西滨,有两个千年小镇-鼎山和蜀山,如今两镇已由丁蜀大桥连成一体.由于现代人讲究简约方便,鼎山就写成了丁山,丁蜀镇统称为丁山镇.一个地名仅五笔,成为全国陶器
二年级学生学习的特点是通过对具体事物或实物模型的感知和操作,在生动具体的情境和具体的数学活动中理解数学、认识数学。因此对学生进行评价时,也应结合具体材料,结合具体情境
通过对陶瓷厂烤花窑、推板窑两种典型的螺旋推进装置工作原理的分析、比较,指出其特点,并提出了一种结构新颖、简单,成本低廉,维护方便,具有高生产效率、高机械效率的螺旋推
介绍了用电镀生产含铬废渣制取氧化铬并以其为基础研制新型乳浊颜色釉的过程,同时确定了氧化铬对钛釉性能和乳浊度的影响,该工艺过程主要如下:通过中和反应器使铁和重金属离子从
0前言在中国的传统文化中,以"吉祥"为主体的词句、对联虽然极为丰富,但最为突出的还是各种图形、标志的吉祥图案.她往往喻示着人们良好的祈求、美好的憧憬或祝福,给人们带来
假文凭、"泡沫文凭"是当前人民群众反映强烈的深层腐败现象.防止和杜绝关系文凭、人情文凭和假文凭的发放,是党中央、国务院赋予各类学校的神圣职责.中共广东省委党校函授教