论文部分内容阅读
随着GPS设备的普及,产生了越来越多的轨迹大数据,为提升综合交通运输服务水平,加快建设交通强国,利用大数据的处理方法对出租车的轨迹数据进行有效的处理分析和存储显得尤其重要。本文基于上海市出租车的GPS轨迹数据,分析了影响司机的收入的几个因素。首先提取并清理GPS定位数据,以获得有效行程的数据集。采用基于MATLAB的大数据处理和存储方法对轨迹大数据进行处理。对GPS数据存在的经纬度异常和温度漂移等问题,提出了几种方法来过滤异常点。利用聚类方法可以准确识别出轨迹缺失的异常点,利用模糊C均值聚类对采样得到的大量冗余数据进行处理,减小无效的数据规模,并验证了聚类结果的准确性。针对现有地图匹配法过于复杂和局限性大等缺点,提出了一种基于椭圆为误差范围的地图匹配法,利用我国道路宽度和GPS高采样精度从而有效的把GPS数据点匹配到正确的道路上。根据处理后的数据对出租车司机收入进行相关性分析:对出租车的OD点进行提取,从而得到出租车在运行中的载客轨迹和时间段。然后对出租车换班行为进行检测,区分出出租车每天由几个司机驾驶,并对出租车收入进行量化,对一天中不同时间司机的平均每小时收入进行分析。对出租车出行频率、出租车行驶里程、出租车占用率进行统计分析,判断其与是否与出租车司机收入相关,并对提高出租车司机收入和缓解出租车司机压力给出建议。对出租车司机的载客行为可视化,提出了移动熵、回旋半径、乘客运送次数、网格热量排序、POI分布密度5个指标为用户画像,进行分析,验证得到分析的结果是准确的,运用层次分析法对影响出租车司机的决策问题进行分析,得到了一种合适的策略判断方案,为出租车司机提供了参考。本文的研究结果可帮助出租车司机进行决策,从而提高出租车司机的收入。