论文部分内容阅读
出租车司机的收入与空载寻客距离、载客距离以及载客路径选择等因素密切相关,经验丰富的高收入司机在这三个方面的能力与刚入行司机相比明显突出。从出租车GPS时序轨迹数据中识别出高收入司机,并挖掘高收入司机在这三个方面的因素特征是本课题需要解决的主要问题。从出租车GPS数据中识别出高收入司机,首先根据出租车轨迹数据中的OD(Original-Destination)标志位将数据划分为载客Trip轨迹点集合和空载Trip轨迹点集合。然而由于GPS数据存在经纬度偏移现象和采样频率较低的问题,Trip集合并不能表示相应的路径。为此利用OpenStreetMap提供的城市道路特征点建立道路网数据结构图,将GPS数据的Trip轨迹点集合转化为实际的出租车Trip路径集合,从而估计得到出租车司机收入。再采用K-Means聚类算法将出租车司机按收入划分为高、中、低三等。在挖掘高收入司机收入影响因素特征时,首先利用Logistic回归模型分析高、中、低收入司机与空载寻客距离、载客距离以及载客速度的相关性,分别得到这三个因素评判司机运营过程的重要阀值。以此为线索筛选高收入司机的空载Trip路径集合、载客Trip路径集合。将一天划分为不同的时间段,按照路径的起始点时间戳将路径集合归为不同时间段,采用DBSCAN算法对同一时间段内的空载Trip路径集合、载客Trip路径集合中各路径的起始点进行聚类,从而得到在特定时空条件下能以较短距离搜索到乘客的卸客点、潜在的高价值乘客载客点。根据速度评价阀值所筛选的高收入司机Trip路径集合可以明确特定时空条件下城市的通畅路径。课题的研究成果揭示了高收入司机在特定时空下以较短空载距离寻客、高价值乘客载客点识别以及载客后通畅路径选择上具有的能力因素特征,挖掘了对应的热点区域信息及交通道路状况。对于中低收入出租车司机提高其收入水平具有指导和应用价值,对于出租车管理部门和政府出台相应的管理政策具有借鉴意义。