论文部分内容阅读
随着机动车保有量的不断增加,城市道路交通拥堵现象不断恶化,仅新建城市道路已经无法满足日益增长的出行需求。精细化地建立车辆群体出行特征、出行需求档案,为定制化的智能交通管理和科学的交通规划提供理论依据,是交通管理者面临的重要课题。精准掌握车辆出行规律需要对车辆轨迹进行详细分析,将轨迹信息进行升华,提炼有效的出行特征指标。机动车数量大,出行复杂,交通管理的对象既不应仅针对某一类机动车,也不应将所有的机动车进行相同处理。因此根据城市交通管理需求,科学的、有效的、定制化的利用出行特征指标对机动车进行分类研究是智能化城市交通管理及规划的基础工作。
本文主要通过对历史RFID轨迹数据挖掘,建立了出行频次、在网时间、轨迹重复率、出行时段,活动偏好区域、干线影响区偏好等出行特征指标体系。分析不同类型车辆的出行时空分布规律,基于GaussianHMM模型,针对私家车、出租车、货车的出行进行表征研究。再针对私家车、出租车、货车的出行特点,进行出行特征指标的定制选取,基于密度峰值的聚类算法(CFSFDP)&BP神经网络的组合模型,辨识出不同的出行模式,即实现出行特征群体的辨识。本文的主要研究内容如下:
(1)对RFID数据进行分析,阐述了RFID的检测原理以及数据优势,并提出针对RFID数据的冗余、错误问题的原始数据预处理详细步骤及流程,最后给出RFID数据关联匹配技术流程,以得到有效完整的可视化数据。
(2)基于RFID轨迹数据研究出行特征指标的提取。根据RFID数据与百度地图行程规划数据的对比,进行出行驻留时间阈值确定研究,以合理的将车辆出行链进行打断处理,为指标提取奠定基础。基于车辆运行的分布特征规律分析,结合RFID数据特点,建立了出行频次、在网时间、轨迹重复率、出行时段,活动偏好区域、干线影响区偏好等特征指标体系。
(3)针对私家车、货车、出租车的车辆出行特征进行分析及建模研究。通过分析私家车、货车、出租车在出行频次、在网时间、轨迹重复率、首次出行时段、出行结束时段特征指标上的统计分布特征,研究不同类型车辆出行特征的差异性特点,再在基于高斯隐马尔可夫混合模型的对私家车、货车、出租车出行特征进行建模研究,其中私家车识别率为95%,货车识别率为62%,出租车识别率为89%,可知基于出行特征指标的特性群体存在更深层次挖掘的可能性。
(4)基于出行特征指标体系,研究了私家车、货车、出租车的二级出行特征群体划分。建立基于改进密度峰值(CFSFDP)算法与BP神经网络算法的出行特征群体辨识模型。在密度峰值算法的基础上,针对算法缺点,参数cd(截断距离)的合理取值以及合理选用局部密度计算方法方面,引入K邻值思想,对原始算法进行改进,使得算法的兼容性增强,更适用于多样化的大数据环境。基于聚类分析后的分类数据,作BP神经网络学习训练。
(5)选取重庆市主城区域内的RFID数据进行实验分析。首先分别基于私家车、出租车、货车提取的出行特征指标,进行改进CFSFDP算法的聚类分析,将私家车划分为3个特征群体,即商用私家车群体、通勤私家车出行、其他私家车出行;货车划分为两个特征群体,分别为长时间运营货车、短时间运营货车类型;出租车同样划分为两种类型,即干线影响区偏好出租车群体、其他区域偏好出租车群体。再基于分类数据进行BP神经网络训练学习,其中私家车出行特征识别模型的识别正确率高达97.2%;货车出行特征识别模型的识别正确率高达95.64%;出租车出行特征识别模型的识别正确率高达99.18%。
本文主要通过对历史RFID轨迹数据挖掘,建立了出行频次、在网时间、轨迹重复率、出行时段,活动偏好区域、干线影响区偏好等出行特征指标体系。分析不同类型车辆的出行时空分布规律,基于GaussianHMM模型,针对私家车、出租车、货车的出行进行表征研究。再针对私家车、出租车、货车的出行特点,进行出行特征指标的定制选取,基于密度峰值的聚类算法(CFSFDP)&BP神经网络的组合模型,辨识出不同的出行模式,即实现出行特征群体的辨识。本文的主要研究内容如下:
(1)对RFID数据进行分析,阐述了RFID的检测原理以及数据优势,并提出针对RFID数据的冗余、错误问题的原始数据预处理详细步骤及流程,最后给出RFID数据关联匹配技术流程,以得到有效完整的可视化数据。
(2)基于RFID轨迹数据研究出行特征指标的提取。根据RFID数据与百度地图行程规划数据的对比,进行出行驻留时间阈值确定研究,以合理的将车辆出行链进行打断处理,为指标提取奠定基础。基于车辆运行的分布特征规律分析,结合RFID数据特点,建立了出行频次、在网时间、轨迹重复率、出行时段,活动偏好区域、干线影响区偏好等特征指标体系。
(3)针对私家车、货车、出租车的车辆出行特征进行分析及建模研究。通过分析私家车、货车、出租车在出行频次、在网时间、轨迹重复率、首次出行时段、出行结束时段特征指标上的统计分布特征,研究不同类型车辆出行特征的差异性特点,再在基于高斯隐马尔可夫混合模型的对私家车、货车、出租车出行特征进行建模研究,其中私家车识别率为95%,货车识别率为62%,出租车识别率为89%,可知基于出行特征指标的特性群体存在更深层次挖掘的可能性。
(4)基于出行特征指标体系,研究了私家车、货车、出租车的二级出行特征群体划分。建立基于改进密度峰值(CFSFDP)算法与BP神经网络算法的出行特征群体辨识模型。在密度峰值算法的基础上,针对算法缺点,参数cd(截断距离)的合理取值以及合理选用局部密度计算方法方面,引入K邻值思想,对原始算法进行改进,使得算法的兼容性增强,更适用于多样化的大数据环境。基于聚类分析后的分类数据,作BP神经网络学习训练。
(5)选取重庆市主城区域内的RFID数据进行实验分析。首先分别基于私家车、出租车、货车提取的出行特征指标,进行改进CFSFDP算法的聚类分析,将私家车划分为3个特征群体,即商用私家车群体、通勤私家车出行、其他私家车出行;货车划分为两个特征群体,分别为长时间运营货车、短时间运营货车类型;出租车同样划分为两种类型,即干线影响区偏好出租车群体、其他区域偏好出租车群体。再基于分类数据进行BP神经网络训练学习,其中私家车出行特征识别模型的识别正确率高达97.2%;货车出行特征识别模型的识别正确率高达95.64%;出租车出行特征识别模型的识别正确率高达99.18%。