基于时间序列的网约车在线司机与乘客发单的供需预测

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:liongliong550
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的兴起,网约车应运而生。在网约车的业务场景里面,特定城市的不同区域的在线司机数差异很大,乘客发单量差异也很大。为了解决区域之间供需不平衡的问题,首先就要对每个区域的供需比有一个准确的预测。而特定区域的供需比随时间变化而变化,与很多外界因数相关,具有周期性,且会因为节假日、恶劣天气等极端事件使得序列出现异常值。用传统的三阶指数平滑处理时不能很好的对异常点做出预测。因此兼顾极端事件的发单量和接单量的预测具有重大的意义。传统的机器学习模型和循环神经网络在时间序列预测的研究方面都取得了一定的成果。本文基于这两个方向,结合具体的业务背景设计出了一种组合预测模型,并且相对现存的方法取得了很大提高。首先我们获取多个城市多个区域在不同时间点的供需比以及区域位置,天气等的历史信息。并对相应特征做了异常值处理、归一化、one-hot、连续特征离散化等初级处理。然后对处理后的特征分别用两种方案做进一步的处理。方案一中,我们分别把供需比序列输入到三阶指数平滑和一阶指数平滑的holt-winter模型里,分别求解模型参数。然后把两个模型线性加权的结果作为一个最终特征。方案二中,我们首先把包含区域特征、天气特征、节气特征、窗口序列特征等的数据整合成[batch,sequence,feature]的形式,把整合的数据同时作为输入和输出去训练一个由五层LSTM构成的自编码器。LSTM包括输入门、输出门和遗忘门。通过前向和后向传播算法迭代到参数收敛得到最佳模型。然后取模型的编码器部分对序列特征进行编码,并把编码器的输出作为最终的多个特征。把前面两个方案输出的数据concat成完整向量,再联合其他特征,一起输入到xgboost模型,并迭代得到最终的模型参数。最后,在测试集上用smape指标度量模型对供需的预测效果。采集前后几个月关于供需的所有数据,输入到上述模型,并训练模型到参数收敛。实验结果表明,通过把一阶指数平滑和三阶指数平滑做加权平均,且融合自编码器,并结合xgboost做预测的方法。比之前传统单一的时间序列预测方法有了显著提高。
其他文献
世界经济论坛新领军者年会——2014年夏季达沃斯于9月10日-12日在天津举行第八届年会。在全球复苏的背景下,创新正在改变人们对于未来经济增速和状况的预期,“推动创新创造价
2012年6月泰兴市黄桥镇某养鸽专业户,饲养的1000多羽肉鸽突然发生呼吸道症状,下痢、便血,并连续发生死亡。黄桥兽医站立即会同市畜牧中心的专家对此进行了详细的调查诊断。1
杜 海波多日的辗转反侧和内心忐忑终于烟消云散。  7月,时任四川省犍为县大兴乡纪委副书记、农业技术服务中心主任的杜海波主动到犍为县纪委监委交代了自己利用职务之便骗取国家补贴资金的问题,并主动上交了其违纪资金。  “我对不起党和国家,对不起组织,对不起家庭,我为我的行为感到耻辱。”在交代了自己的违纪违法事实后,杜海波在他的忏悔书中如此写道。  工作中发现“财源”  杜海波谈起交代问题后感受时说,压在
针对传统多光谱成像颜色测量系统光谱反射率重建算法计算量大、操作繁琐耗时、成本高等缺点,提出一种由LED主动照明光源和黑白高速相机构建的多光谱成像颜色测量系统。采用多
为降低实验兔的饲养成本,提高实验兔的生产效率,妊娠母兔的饲养管理尤为重要。下面就妊娠母兔饲养管理中常见的问题及其解决方法加以介绍。
期刊
近年来,国内一些高校为走出财务管理专业实践难的困境,开始在校内开设财务管理实验课,这是一个非常好的尝试。但与此同时也应看到,目前有关财务管理实验教学的建设还不成熟,尤其是
俄罗斯总统新聞秘书克里洛娃称,一家商标名称为“克里姆林宫品质”的乳制品在线商店将开张营业,出售牛奶、酸奶等原本专供于政府高官、国家杜马议员等人士的食品,并且售价不会高于超市里的价格,确保所有民众都能买。在俄罗斯,高官仍能像苏联时期享受到专门生产的食物。民众对此反应不一,有的不介意自己的餐具上带有国徽图案,而有的则为官员们仍享有“特供”食品感到愤怒。
资金集约化是一项复杂的系统管理工程,面临诸多问题,必须综合考虑各种因素进行资金管理模式的再造。
随着中国国际化进程的加快和金融保险体制改革的推进,国内保险公司纷纷寻求境外上市,但境外上市后,一方面,企业面临日益增大的竞争压力,要求企业加强内部管理,提高内部管理水
2008年5月16日,山西省注册会计师协会(以下简称省注协)在太原召开届八次常务理事会。会议由芦振基会长主持,山西省财政厅党组成员、总会计师武涛同志出席会议并作了重要讲话。