论文部分内容阅读
摘 要 互联网时代提升用户体验主要通过用户画像分析技术,即基于个人的手机、网页浏览痕迹等了解用户需求。本文通过将用户画像的概念转移应用到交通领域,利用交通大数据分析出行者交通选择行为在不同交通状况下的异同,为交通规划决策提供量化支持和决策依据。
关键词 出行者画像;出行选择;大数据;交通行为
中图分类号 U1 文献标识码 A 文章编号 2095-6363(2017)12-0110-02
所谓用户画像,一是指单个用户所有标签的集合,通过可以获取的用户的社会属性(如性别、年龄、工作、收入等),将用户所有的选择偏好综合起来,勾勒出该用户的整体特征与轮廓;二是根据其属性或标签集进行分类和预测,从而实现特定的目的,如信用评级、受众类型等的划分。用户画像更深层次的意义,是根据用户数据和行为,为特定的客户进行按需定制。在大数据分析中对特定的用户群体进行分类分析,形成不同维度的属性标签,从而采取不同的商业行为和措施,以达到特定的利益目标。
对于出行者行为的画像来说,首先需要指出的是分析的对象不是特定的某个出行者,而是每个出行者参与到整个交通系统中所呈现的群体行为,从非集计的角度来分析和研究个体行为对整个交通系统的影响,同时对相同交通行为的选择结果进行分析,找出影响群体交通选择行为的主要因素,量化影响因素的程度和范围。
1 交通大数据
随着智能交通的发展,与交通相关的数据已经从传统的粗放型、局部性的数据逐渐细化,主要的新型数据包括:GPS数据、公交刷卡数据、手机信令数据、网页爬取数据、卡口数据与路网数据等
2 交通行为画像
2.1 大数据融合画像
交通行为画像就是基于以上的各类交通数据,整个多源数据融合过程其实是作为整个交通大数据应用的一部分,使用多源数据提取出行者的详细出行信息,形成并探讨其实际出行选择与备选方案之间的差别;对出行链效用方程中的参数进行估计,并将出行根据大数据以及传统的城市人口数据和土地规划等结合起来对整个城市的出行者进行泛化和扩样,利用非集计模型对整个城市的出行者进行仿真并将结果应用到实际工作中;同时,仿真模型再与大数据中的各项观测数据进行对比,矫正模型参数和精度。整个过程循环递进优化,同时勾勒的出行者画像也在不断的迭代调优中更加准确。
2.2 出行链
出行者通常会按照自己的意愿或作为社会一份子而产生的活动安排出行,而各项社会活动或生计需求就会产生各种时空上的移动,把出行者的各项活动之间用出行连接起来就形成了出行链。
一般情况下,正是大量工作开始时间相近的刚性出行活动导致了交通系统的高峰期,而大量出行时间、地点等的弹性可变的非刚性出行导致了交通系统的不确定性。基于出行链的出行理论的主要有以下5点:
1)出行的需求源于社会经济活动的需要。
2)人的行为受时空的限制要在不同时间和地点进行不同活动, 并且去各个活动地点都要花费时间。
3)通常人的出行都是以家庭为基本单位,家庭影响个人的活动和出行决策。许多决策作为家庭决策的一部分,受家庭中其它成员的限制,所以家庭类型和生活方式也影响个人的选择。
4)活动和出行决策是动态的 一次决策受过去和预期事件的影响[1],同时也受到当前环境的影响,出行计划可能根据实际情况而实时变化。
5)出行过程中出行者将面临一定数量的选择,并在各个选项间衡量对比后作出决策,最终实施的出行计划虽然可能由于路网的动态变化和交通系统的不确定性导致与预期有所差别,但却是决策时选择集中效用最大的一项。
作为出行行为决策的出行者(或家庭)在出行活動中面临的一系列可以选择的、选择分肢相互独立的集合中,会选择他认为效用最大的选择项,这个被称为效用最大化行为假说。而量化这一过程的目前广泛应用的模型为Logit模型,Logit模型正是以某次出行行为的选择集为基础设定效用函数,计算各选项被选择的概率并估计影响各选项的参数,而将每一次的出行连接起来,就形成了基于一天活动的出行链。
出行的计算考虑了出行模式,距离、出行时间、换乘因素,出行费用等,而其中的参数就是描述出行者画像的主要量化指标。这些参数的值决定了不同出行者在面临不同的选择方式时的决策结果,对这些参数的估计就是多源数据融合的出行者画像的最重要的部分,也是对出行者出行过程最精确对描述。
2.3 出行者行为分析和仿真
通过多源数据的融合,可以得到部分出行者的出行,再根据城市土地规划、各区人口数据等将数据进行泛化扩样,从而得到了整个城市所有出行者一天的交通活动的初始计划,并利用MATSim对其进行仿真。为保证模型的仿真精度,使用MATSim对整个城市的交通系统的运行状况及出行者的出行采取开放的方式,即出行者的出行画像、基本出行集等按照多源交通大数据进行校正,每一次的数据矫正是建立在其他数据源的基础上进行迭代寻优,以迭代收敛为主要目标,旨在充分利用和融合各数据源,从而使模型精度不断提高。
3 应用
对出行者的出行行为进行画像,根据其选择偏好进行参数估计,最终通过仿真模型将整个城市的模型进行仿真,其主要的应用可以体现在以下几个方面。
3.1 交通相关政策的辅助决策
通过对如拥堵收费、划定公交车专用道、换乘优惠、停车费用调控等相关交通政策实施前后整个交通系统运行状况的仿真,可精确量化政策实施前后各项交通指标,如道路使用效率、出行者广义出行费用的变化以及出行方式变化比例等,为相关政策和措施提供决策支持。
3.2 片区交通改善的前后对比
对于某一片区交通设施、交通组织方式等的改善方案进行仿真,针对改善目的对各个方案进行量化评价和对比,从而选出最有改善方案。
3.3 出行者出行的出行划分和诱导建议
对整个深圳市区域内所有出行者的仿真过程,是对出行者出行时所面临的一系列的决策进行分析,通过对这些离散选择模型的分析和研究,了解其选择过程中的决定因素,对整个系统对仿真和掌控了解可以很好地把握各项交通相关决策的临界点,对出行进行诱导,从而降低路网交通压力,提高出行者出行效率。
3.4 公共交通优化的对比与决策支持
对整个深圳市的交通系统进行仿真,了解使用公交系统的实际情况,掌握公交、地铁的客流集散情况,可根据实际的客流集散点对公交线路、班次进行优化,同时对比优化前后的交通状况。
4 结论
在“互联网+”的背景下,大数据技术在交通业务领域的应用不断扩展,而智能手机、物联网等技术的不断更新,进一步触发了交通规划和管理模式的转变。在妥善解决个人信息安全与隐私保护的前提下,多源数据的融合和应用在未来一段时间内将成为趋势。利用数据融合对出行者的交通相关行为的画像,有利于各方充分利用现有的数据资源,有效实现规划和管理的精准实施和相关政策、措施的支撑,同时在出行者行为和选择模型方面也可进行创新性的探索和实践。
参考文献
[1]余孟杰.产品研发中用户画像的数据模建——从具象到抽象[J].设计艺术研究,2014,4(6):60-64.
[2]刘海,卢慧,阮金花,等.基于“用户画像”挖掘的精准营销细分模型研究[J].丝绸,2015,52(12):37-42.
[3]张慷.手机用户画像在大数据平台的实现方案[J].信息通信,2014(2):266-267.
关键词 出行者画像;出行选择;大数据;交通行为
中图分类号 U1 文献标识码 A 文章编号 2095-6363(2017)12-0110-02
所谓用户画像,一是指单个用户所有标签的集合,通过可以获取的用户的社会属性(如性别、年龄、工作、收入等),将用户所有的选择偏好综合起来,勾勒出该用户的整体特征与轮廓;二是根据其属性或标签集进行分类和预测,从而实现特定的目的,如信用评级、受众类型等的划分。用户画像更深层次的意义,是根据用户数据和行为,为特定的客户进行按需定制。在大数据分析中对特定的用户群体进行分类分析,形成不同维度的属性标签,从而采取不同的商业行为和措施,以达到特定的利益目标。
对于出行者行为的画像来说,首先需要指出的是分析的对象不是特定的某个出行者,而是每个出行者参与到整个交通系统中所呈现的群体行为,从非集计的角度来分析和研究个体行为对整个交通系统的影响,同时对相同交通行为的选择结果进行分析,找出影响群体交通选择行为的主要因素,量化影响因素的程度和范围。
1 交通大数据
随着智能交通的发展,与交通相关的数据已经从传统的粗放型、局部性的数据逐渐细化,主要的新型数据包括:GPS数据、公交刷卡数据、手机信令数据、网页爬取数据、卡口数据与路网数据等
2 交通行为画像
2.1 大数据融合画像
交通行为画像就是基于以上的各类交通数据,整个多源数据融合过程其实是作为整个交通大数据应用的一部分,使用多源数据提取出行者的详细出行信息,形成并探讨其实际出行选择与备选方案之间的差别;对出行链效用方程中的参数进行估计,并将出行根据大数据以及传统的城市人口数据和土地规划等结合起来对整个城市的出行者进行泛化和扩样,利用非集计模型对整个城市的出行者进行仿真并将结果应用到实际工作中;同时,仿真模型再与大数据中的各项观测数据进行对比,矫正模型参数和精度。整个过程循环递进优化,同时勾勒的出行者画像也在不断的迭代调优中更加准确。
2.2 出行链
出行者通常会按照自己的意愿或作为社会一份子而产生的活动安排出行,而各项社会活动或生计需求就会产生各种时空上的移动,把出行者的各项活动之间用出行连接起来就形成了出行链。
一般情况下,正是大量工作开始时间相近的刚性出行活动导致了交通系统的高峰期,而大量出行时间、地点等的弹性可变的非刚性出行导致了交通系统的不确定性。基于出行链的出行理论的主要有以下5点:
1)出行的需求源于社会经济活动的需要。
2)人的行为受时空的限制要在不同时间和地点进行不同活动, 并且去各个活动地点都要花费时间。
3)通常人的出行都是以家庭为基本单位,家庭影响个人的活动和出行决策。许多决策作为家庭决策的一部分,受家庭中其它成员的限制,所以家庭类型和生活方式也影响个人的选择。
4)活动和出行决策是动态的 一次决策受过去和预期事件的影响[1],同时也受到当前环境的影响,出行计划可能根据实际情况而实时变化。
5)出行过程中出行者将面临一定数量的选择,并在各个选项间衡量对比后作出决策,最终实施的出行计划虽然可能由于路网的动态变化和交通系统的不确定性导致与预期有所差别,但却是决策时选择集中效用最大的一项。
作为出行行为决策的出行者(或家庭)在出行活動中面临的一系列可以选择的、选择分肢相互独立的集合中,会选择他认为效用最大的选择项,这个被称为效用最大化行为假说。而量化这一过程的目前广泛应用的模型为Logit模型,Logit模型正是以某次出行行为的选择集为基础设定效用函数,计算各选项被选择的概率并估计影响各选项的参数,而将每一次的出行连接起来,就形成了基于一天活动的出行链。
出行的计算考虑了出行模式,距离、出行时间、换乘因素,出行费用等,而其中的参数就是描述出行者画像的主要量化指标。这些参数的值决定了不同出行者在面临不同的选择方式时的决策结果,对这些参数的估计就是多源数据融合的出行者画像的最重要的部分,也是对出行者出行过程最精确对描述。
2.3 出行者行为分析和仿真
通过多源数据的融合,可以得到部分出行者的出行,再根据城市土地规划、各区人口数据等将数据进行泛化扩样,从而得到了整个城市所有出行者一天的交通活动的初始计划,并利用MATSim对其进行仿真。为保证模型的仿真精度,使用MATSim对整个城市的交通系统的运行状况及出行者的出行采取开放的方式,即出行者的出行画像、基本出行集等按照多源交通大数据进行校正,每一次的数据矫正是建立在其他数据源的基础上进行迭代寻优,以迭代收敛为主要目标,旨在充分利用和融合各数据源,从而使模型精度不断提高。
3 应用
对出行者的出行行为进行画像,根据其选择偏好进行参数估计,最终通过仿真模型将整个城市的模型进行仿真,其主要的应用可以体现在以下几个方面。
3.1 交通相关政策的辅助决策
通过对如拥堵收费、划定公交车专用道、换乘优惠、停车费用调控等相关交通政策实施前后整个交通系统运行状况的仿真,可精确量化政策实施前后各项交通指标,如道路使用效率、出行者广义出行费用的变化以及出行方式变化比例等,为相关政策和措施提供决策支持。
3.2 片区交通改善的前后对比
对于某一片区交通设施、交通组织方式等的改善方案进行仿真,针对改善目的对各个方案进行量化评价和对比,从而选出最有改善方案。
3.3 出行者出行的出行划分和诱导建议
对整个深圳市区域内所有出行者的仿真过程,是对出行者出行时所面临的一系列的决策进行分析,通过对这些离散选择模型的分析和研究,了解其选择过程中的决定因素,对整个系统对仿真和掌控了解可以很好地把握各项交通相关决策的临界点,对出行进行诱导,从而降低路网交通压力,提高出行者出行效率。
3.4 公共交通优化的对比与决策支持
对整个深圳市的交通系统进行仿真,了解使用公交系统的实际情况,掌握公交、地铁的客流集散情况,可根据实际的客流集散点对公交线路、班次进行优化,同时对比优化前后的交通状况。
4 结论
在“互联网+”的背景下,大数据技术在交通业务领域的应用不断扩展,而智能手机、物联网等技术的不断更新,进一步触发了交通规划和管理模式的转变。在妥善解决个人信息安全与隐私保护的前提下,多源数据的融合和应用在未来一段时间内将成为趋势。利用数据融合对出行者的交通相关行为的画像,有利于各方充分利用现有的数据资源,有效实现规划和管理的精准实施和相关政策、措施的支撑,同时在出行者行为和选择模型方面也可进行创新性的探索和实践。
参考文献
[1]余孟杰.产品研发中用户画像的数据模建——从具象到抽象[J].设计艺术研究,2014,4(6):60-64.
[2]刘海,卢慧,阮金花,等.基于“用户画像”挖掘的精准营销细分模型研究[J].丝绸,2015,52(12):37-42.
[3]张慷.手机用户画像在大数据平台的实现方案[J].信息通信,2014(2):266-267.