新能源乘用车辆应用场景识别方法研究

来源 :交通科技与管理 | 被引量 : 0次 | 上传用户:dayu1215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文通过研究新能源车辆出行特征,从出行强度、时空轨迹角度,挖掘车辆行为特征差异,构建表征车辆属性的指标维度,提出无监督学习中的聚类分析法,识别新能源车辆的应用场景,采用上海市新能源车辆数据进行验证,证明提出方法的准确性。
  关键词:新能源车;出行强度;时空轨迹;聚类分析
  0 引言
   随着充电技术不断成熟,相关政策鼓励,新能源动力车辆得到了广泛推广。2020年,中国新能源汽车销量达到136.7万辆[1]。同时,新能源车辆用户行为研究逐步成为热点,包括出行行为、充电行为,涉及用户分类研究,常见地将用户根据行驶里程分为长里程、短里程用户[2,3],缺少用户使用场景深入研究,以及大规模数据实践案例。然而,新能源用户场景识别划分,不仅有助于推动新能源车辆推广应用,而且能有效支撑政府对于网约车辆监管,具有很强的必要性。
   本文提出一种基于无监督聚类法的车辆应用场景识别方法,通过挖掘时空行为特征差异,构建衡量车辆属性的指标维度。采用K-MEANS算法对车辆进行聚类分析,综合手肘法和轮廓系数,法判断最优分类数,根据每类结果指标特征,确定车辆具体应用场景,即私家通勤、兼职网约、专职网约车辆。最后,采用上海市新能源汽车出行数据,识别车辆应用场景,通过与互联网平台注册数据相互校验,验证算法的精度和有效性。
  1 数据介绍及预处理
   研究数据来源于上海市新能源汽车公共数据采集与监测平台,分析样本为乘用车辆10万辆,其中,已有网约标签车辆1 000辆。数据信息包括采集时间、经纬度、累计里程等字段,采集频率为10 s~30 s。
   数据预处理步骤分为数据清洗、车辆次行切割、车辆日出行数据处理。数据清洗中,去除里程数据丢失严重的车辆,过滤经纬度、时间跳变的记录;以30 min间隔,将原始数据进行切分,形成车辆次出行时空轨迹,即时间、经纬度序列;以日为单位,处理车辆每日出行特征,包括日出行时间、日出行里程。
  2 行为特征分析
   从车辆出行强度、时空轨迹方面,挖掘样本车辆、网约车辆使用特征差异性,提出表征车辆应用场景属性的多维度指标,作为聚类分析模型输入。
  2.1 出行强度特征
   出行强度是衡量车辆应用场景最直观特征,常用的评价指标,如行驶里程、时长、次数。相比周末、节假日不确定性影响,工作日出行特征趋于稳定,选择工作日时间指标值;由于数据源特点,提取载客次行为有难度,不同场景车辆日出行次数差异不大;为减少极端、随机日出行的影响,考虑反映月出行强度的指标。基于此,选择工作日均出行时间、工作日均出行距离以及每月工作日百公里天数,作为出行强度特征指标。
   图1~3为出行强度指标统计分布的直方图和箱线图,从图中看出,相比网约车辆,未知车辆数值区间跨度更大,中位数数值明显较低,四分位箱体更窄,异常值集中在较大值一侧,分布呈现右偏态,而网约分布则呈现标准正态分布。反映未知車辆样本混合了私家、网约以及兼职等不同场景的车辆,且出行强度较低的样本分布更为集中。
  2.2 轨迹相似度特征
   轨迹作为一种重要的时空对象数据类型和信息源,通过提取轨迹数据中的相似性与异常特征,并有助于发现其中有意义的模式。目前,时空轨迹的应用范围涵盖了人类行为、交通物流等。本文选取轨迹相似度特征,作为衡量车辆应用场景另一维度,相比出行强度,侧重描述车辆出行路径的规律性:私家通勤车辆轨迹相对稳定,一段时间内具有较高的相似性;网约车辆出行随机性较强,轨迹之间的关联度较低;兼职车辆轨迹特征处于两者之间。
   考虑车辆轨迹长度灵活性,采用动态时间归整(DTW)算法计算轨迹之间的相似度值[4]。同时,为了衡量一段时间内的轨迹特征,以车辆所有轨迹间相似度的均值,作为轨迹相似度特征的指标。
   图4分别为典型车辆轨迹相似度时间变化图、轨迹相似度数值分布直方图,从轨迹相似度时间变化和分布情况,网约车辆相似度值区间大、极值高,且轨迹波动性较大;相比之下,未知车辆具有明显的周期性,且轨迹相似度集中在低值区域。从轨迹相似度角度判断,未知车辆是私家通勤车辆可能性较高。
  3 方法描述
   在车辆行为特征研究基础上,采用无监督学习K-MEANS聚类方法,对特征相近车辆进行聚类分析,根据每类的特征值情况,进一步判断每类车辆应用场景。
  3.1 分类最优K值确定
   K-MEANS算法关键需预先确定分类k值,最优k值对应车辆场景类别。本文综合手肘法和轮廓系数法[5],判断k值。
   (1)手肘法,随着聚类数k的增大,样本划分更加精细,每个簇的聚合程度逐渐提高,误差平方和sse逐渐变小。当k小于真实聚类数,sse下降幅度很大,当k到达真实聚类数,sse的下降幅度会骤减。
   (2)轮廓系数法,选择轮廓系数较大所对应的k值。当样本i轮廓系数接近1,说明样本i聚类合理,接近-1,则说明样本i更应该分类到另外的簇。
   图5为误差平方和、轮廓系数随着k值变化的曲线图。根据手肘法,k>3误差平方和值降幅明显放缓,k最优值为3;根据轮廓系数法,k最优取值为2、3。综合考虑,车辆场景聚类为3类,即私家通勤、兼职网约、专职网约。
  3.2 K-MEANS聚类算法步骤
   K-MEANS是一个迭代型算法[6],在确定最优分类k值为3的基础上,具体算法步骤:
   (1)准备车辆特征向量数据集,其中,代表车辆集合,分别代表日均出行里程、日均出行时间、百公里天数、轨迹相似度四个特征值向量;
   (2)随机初始化3个数据点,作为3组类别中心点;
   (3)计算每个数据点到中心点的距离,选择距离最短的,将车辆划分到该类别,最终得到3个类别的车辆集合,,;
   (4)对于每个类别,重新计算其中心点,其中,,;
   (5)重复步骤(3)、(4),直到每一类中心在每次迭代后变化不大为止,得到3组车辆集合,即车辆应用场景聚类结果。
  4 结果和分析
   利用构建的算法,对上海市未知车辆的应用场景进行识别,结果如表1所示。私家通勤、兼职网约、全职网约车辆数占比分别为70.7%、15.8%、13.5%,工作日均出行距离分别为41、116、213公里,日均出行时间分别为105、246、557分钟,与相关调研的结论一致:私家通勤车辆以上下班为主,通勤距离通常小于50 km,专职车辆在使用上与巡游出租车相近,行驶距离通常大于200 km,而兼职车辆处于私家、专职之间,出行强度适中。在此基础上,进一步对1 300辆合规网约车辆进行聚类分析,网约场景的识别率达到83%,识别准确率较高。
  参考文献:
  [1]2020年汽车工业经济运行情况简析[R].上海省汽车行业协会,2020.
  [2]上海市新能源汽车大数据研究报告2020[R].上海省汽车行业协会,2020.
  [3]夏严.基于用户出行行为特性的插电式混合动力汽车全生命周期效能分析[D].东南大学,2019.
  [4]龚玺.时空轨迹聚类方法研究进展[J].地理科学进展,2011(30):522-534.
  [5]董炎焱.基于SSE的全局最优K-means算法[J].电子技术与软件工程,2018(11):196-197.
  [6]秦嘉诚.基于K-means聚类算法优化方法的研究[J].信息技术,2019(1):66-70.
其他文献
摘 要:随着国际民航运输业的快速发展,空中交通量迅速增加,导致空域拥堵。不仅造成飞行冲突,而且影响飞行安全,对空中交通网络构成障碍。我们根据世界各国的特点和具体情况,运用科学的管理方法,建立了自己的交通管理中心。对流量的协调、控制和管理起到了重要作用。同时也大大提高了空域利用率,减轻了管制员的负担,提高了飞行安全水平。因此,空中交通流量管理已成为民航的一项紧迫任务。  关键词:空中交通;过程管理;
期刊
摘 要:我国文件规定行驶速度120 km/h以下的铁路可实行非封闭式管理,这种区段铁路多为货运,对旅客安全影响较小,但也存在较多隐患,因此本人从实际情况出发,基于普速铁路周围居民非法种植、违法违建、行人拦路、危树倒落等外部环境管理难点出发,探讨如何基于现状改善普速铁路外部环境,旨在促进普速铁路外部环境的有效管理,保障普速铁路的平稳运行。  关键词:普速铁路;外部环境;管理难点;管理策略  0 引言
期刊
摘 要:中共十九大首次提出乡村振兴战略,提出“五大振兴”。作为解决“三农”问题的新举措,乡村振兴战略也进入了人们的视野。从中国当前发展形势看,城乡发展不平衡、农村发展不足是民生问题的首要课题。基于乡村规划方法创新的重要性,本文分析了发展中地区农村规划存在的问题,提出了发展中地区农村规划的创新方法,为乡村规划方法创新研究提供有效的参考依据。  关键词:乡村振兴;乡村规划;欠发达地区;问题;规划方法;
期刊
摘 要:在当前汽车产业转型的大环境下,汽车企业纷纷加大了新能源汽车的研发,新能源汽车产销量都取得了飞跃式的发展。其中的纯电动车作为新能源汽车的主力车型之一,在近年来发展迅猛。但受限于技术积累、客户满意度和扶持政策等因素的影响,纯电动车的发展瓶颈也逐渐显现。本文通过对国内纯电动车市场现状进行研究,结合当前纯电动车的发展制约因素,提出相应的解决建议,并对纯电动车的发展前景进行分析预测。  关键词:纯电
期刊
摘 要:道路交通管理学科教学研究目的,旨在认识道路交通管理学科教学规律。围绕“课程教学目的”进行“教学内容改革”,依据“教学内容”进行“教学方法改革”,按照“教学方法”进行“考核方式改革”,研究具有中国特色的道路交通管理学科教学体系。  关键词:道路交通;管理学科;教学研究  1 诸论   经济发展,交通先行,交通是经济发展动脉。   我国社会的主要矛盾已经转化为“人民日益增长的美好生活需要和
期刊
摘 要:随着国家经济的快速发展和进步,城市的发展也越来越好,各类资源在城市中也得到了高度的集中,城市的交通运输呈现爆发式增长趋势。这使得城市道路基础设施需要不断建设与完善,满足运输需求。由于城市混合交通流的特点,必然存在诸多道路交叉的问题。多路交叉一方面降低了交通通行效率,另一方面增加了交通事故发生的概率,在目前城市交通运输快速增长的态势下,多路交叉问题越来越复杂,往往成为城市交通的“堵点”,因此
期刊
摘 要:铁路站台限界是铁路各种重要基础标准之一,它不仅关系到机车车辆的运行安全,同时还关系到乘客的人身安全。精确的测量站台限界对铁路安全运输工作有着重要意义。文章旨在通过探讨站台限界测量方法,为站台限界测量工作提供一定的借鉴。  关键词:站台;建筑限界;限界测量;测量方法  1 工程概况   莞惠城际道滘站(含)至惠州客运北站(含)GDK2+  591.092~GDK105+930,正线全长99
期刊
摘 要:本文对120型制动阀作用不良分析,主要原因为滑阀阀面出现划伤引起的制动故障。通过对机器研磨后的滑阀采用“十字”阀面研磨法进行校准,发现制动阀运用一段时间后滑阀与滑阀座接触面之间的改性甲基硅油含量相比工艺改进前有明显增加,能形成稳定的油膜状态,从而使滑阀与滑阀座之间的润滑性能得到显著提升,有效降低了铁路货车制动典型故障发生率。  关键词:铁路货车;120型制动阀;典型故障率;滑阀“十字”研磨
期刊
摘 要:现阶段,国际能源的形势变得逐渐紧张起来。身为高耗能的行业,建筑行业中的节能环保工作已然变成现下需要解决的问题[1]。新型绿色建筑也可以叫作节能建筑,设计观念就是有效地借助可再生资源,就建筑开始的设计环节到后续的建造环节是都需要依据这个理念展开。而新型绿色建筑会比以往建筑更为关注节约环保,不只能够有效地限制能源消耗,还给住户的生活提供了便利,增强住户在居住期间的舒适度。因为新型绿色建筑所具有
期刊
摘 要:本文为解决石家庄市交通拥堵问题,结合石家庄市现状,通过城市道路、轨道交通、机动车等方面的统计数据,使用ISM模型分析了石家庄综合交通存在的问题。深入探讨了石家庄市交通在基础设施、通行能力等方面存在的问题。并结合国家相关规范,借鉴国内外交通拥堵治理经验,对石家庄市交通问题从发展、创新、技术等角度提出使用新型智慧交通灯和新型索轨的对策与建议,从而使交通拥堵问题在路面、空中分别得以解决,最终使得
期刊