论文部分内容阅读
电子商务盛行的今天,物流行业空前繁荣,物流车辆的海量GPS数据量也越来越多,这些数据包含很多关于交通路况、车辆甚至社会经济发展等信息。轨迹数据挖掘主要通过统计和分析车辆行驶距离、停车时间、地理位置信息、车辆特征等发现货运线路特征,为物流公司提供基于时间、成本等车辆调度方案以及衍生出来的一系列LBS[1]应用提供服务。本文以海量GPS数据作为数据源,利用海量轨迹数据挖掘和道路推荐相关理论,通过建立聚类模型和分析海量GPS数据来了解物流车辆行驶规律,提出针对物流车辆货运线路推荐系统的设计框架并实现。其中重点就是数据预处理方法,停车点侦测和路径分割方法,相似货运轨迹聚类和货运线路推荐四个方面进行了深入研究。具体工作如下:(1)作为轨迹数据挖掘的必要工作,研究了预处理方法,包括数据清洗,数据中的异常进行侦查和排除,并针对本系统所有的GPS数据进行了特征分析和提出了一种基于历史轨迹数据的异常点检测算法。本文提出的算法在处理海量轨迹数据时具有时间复杂度低的特点。(2)停车点侦测和路径分割可以发现物流车辆的上下货的模式,本文依据朴素贝叶斯算法提出一种新的基于历史数据的路径分割算法,根据物流车辆在上下货时的停车和普通停车在时空属性上的不同,将轨迹进行分割。(3)相似货运轨迹聚类将相同起始点和终点的轨迹规则化后投射到同一纬度然后分析轨迹特征,采用K均值聚类算法将这些规则化后的轨迹聚类,聚类后的结果中可以发现物流车辆频繁的行驶轨迹。(4)货运线路推荐方面,设计了基于历史轨迹数据在时间,距离以及成本的不同,得出相应的推荐线路指导物流司机采用合理的行驶方案。经测试表明,论文中使用的轨迹预处理方法与传统预处理方法相比速度更快、效率更高,但是牺牲了一些准确度,停车点侦测和轨迹分割达到了良好的效果。研究成果对于缺失车辆卸货点的轨迹分析有十分重要的理论意义。