论文部分内容阅读
摘要:经过多年的实践,上海等国内发达城市已逐步将大数据手段引入交通规划的数据获取、问题挖掘等多个方面,在规划项目与课题研究中取得了阶段性成果,并朝着更准确、更高效、更人性化的方向发展。不过目前,大数据手段在交通规划领域的应用仍处在起步阶段,对于大数据概念缺乏统一的认识,与此同时大数据的数据来源与基础理论仍存在一定缺陷。正如大数据研究方法自身的现实与理论困境中所描述的,上海交通规划的大数据实践也同样面对着“全样本”的有偏性、基础理论缺失、官方数据的垄断瓶颈等问题。面对热潮中的大数据概念,规划师需要冷静面对,在积极拥抱新技术方法的同时保持冷静。
引言
2009年,google公司通过比对2003年至2008年季节性流感传播时期的搜索数据,成功预测了甲型H1N1型流感的传染情况,开启了时代对于大数据的认知。在我国,2013年被称为大数据元年,2014年大数据概念被写入《政府工作报告》,作为一项基础性战略资源,进入城市规划、交通规划等多个领域。
近年来,大数据(Big Data)概念的火爆与互联网热潮的发展有着密不可分的關系,各行各业均产生了不少基于“大数据”概念的实践行动,交通规划也不例外。但在热潮的背后,“大数据”的基本概念和内涵特点仍众说纷纭,未能形成统一的认识,涉及大数据概念的研究往往数量庞大却众说纷纭,大数据概念的不同理解也带来研究与实践的差异。对此,笔者倾向于通过数据特征与价值取向两个方面界定大数据概念,并以此为基础展开对“大数据”在交通规划领域的思考。
一、“大数据”概念及其规划应用
笔者认为,大数据概念包含两个主要特征。从数据的特征来看,大数据的数据选取往往无限接近于研究对象的全样本。方法上改变传统依托少量数据并利用统计学办法获得最多信息的做法,研究准确度上避免了样本选取带来的必然误差。值得注意的是,全样本的数据特征不是一个数据的数量概念,而是指数据与研究对象全体的相对关系。因而一旦研究的数据对象不能视为研究对象的整体,纵使研究的数据量非常庞大,仍不能算作利用大数据的研究办法。
从研究的价值取向来看,大数据的研究往往更多注重于研究内容的时效性与对未来的预见性。[1]在数据越来越多的情况下,使用全样本的数据往往需要付出一定的代价,即错误数据的获取。对于传统研究方法,因统计的数据量较少,些许错误的数据容易造成极大的研究误差,故而研究在数据获取与清洗过程中往往花费大量的时间,力求数据的精准。大数据方法与此不同,全样本的获取与庞大的数据量必然带来错误的数据内容,但错误的数据与内容在全样本中占比比较小,在适度的清洗下,部分牺牲结果的精确性能够有效提升大数据研究的时效性,提供连贯的、高频率的研究结果,并利用数据的相关性实现对未来的预见。
大数据方法在城市规划与交通规划领域,已有大量研究成果。如龙瀛团队对北京公共交通使用情况、[2]职住平衡等多方面的研究,利用公交卡刷卡数据基于数据增强设计方法,获取并挖掘北京市公共交通不同使用人群、不同使用时间的不同特征;[3]杨东媛教授对于使用大数据变革交通规划理论的探索,尝试通过建立在理论基础上的决策、判断、概念框架,将大数据分析技术、模型、方法纳入统一分析模板,提供一个新型理论框架。[4]在规划实践中,上海市城市规划设计研究院、上海城市交通设计院、北京交通发展研究院等北京、上海、广州、深圳城市规划、交通规划从业人员也已逐步通过使用公交卡数据、手机信令数据作为大数据研究的基础,为各类城市规划、交通规划作支撑。例如张天然利用手机信令数据对上海市市域职住空间的分析,[5]丁亮、钮心毅、宋小冬对上海市就业中心体系的研究等。[6]
从参与团队的性质来看,大数据在交通规划中的参与团队主要包含3类,以百度、阿里为代表的互联网企业,作为大数据的生产与处理方,生产了POI兴趣点数据、道路拥堵数据等大数据分析常用数据,提供了基于智慧城市平台的智慧交通解决方案,并出台基于自身数据平台的研究报告;以交通设计院、规划设计院为代表的规划设计与规划研究机构,作为大数据的应用与挖掘方,将大数据挖掘的成果直接应用于各类规划项目之中;以大学、研究院为代表的交通研究机构,作为大数据研究方法的探索方,尝试各类研究模型与研究方法,为大数据在交通规划中的应用提供理论基础。
从现有研究内容与规划方法上看,目前大数据在交通规划中的应用往往体现研究数据的全样本特征,无论是使用全年的公交卡刷卡数据还是利用手机信令数据,均尝试通过全样本数据研究交通特征,实现对规划决策的支撑。[7]然而针对大数据分析所带来的及时性特点则少有涉及,仅百度、阿里等商业性公司提供的交通拥堵预测服务具有及时性特点。笔者认为,此种情况的产生主要源自交通规划现阶段的自身特征。交通规划作为一项具有延续性的公共政策,不同于商业领域的应用,应具有合法性、权威性、延续性,即规划成果的内容需经过法定程序从而获得合法性,并伴随着政府的强制力获得权威性。这使得传统交通规划难以利用大数据时效性特征,实现对交通问题的及时反馈、实时追踪、问题预警。
二、“大数据”的技术变革
大数据方法不仅优化了传统交通规划的数据方法,实现了规划方法的量变,更从规划效果与研究视角上实现了质的变化,并将在未来提供更多的可能。从规划研究与规划实践来看,大数据的应用正从三个方面改变传统交通规划的编制。
(一)研究方法统一宏观至微观层面 传统研究交通规划往往使用抽样调查的办法研究规划项目,因工作量的差异,不同层面交通规划往往需要不同调查。不同的时间、日期、人员乃至方法,为不同尺度的规划项目带来了误差与矛盾,难以实现对同一区域宏观至微观的统筹。
大数据手段不同于抽样调查,能够将传统研究样本扩展到研究区域的每个个体,并在数据处理层面实现宏观至微观的分层,从而实现对宏观、中观、微观的全面统筹。依托同一数据源,针对不同需求使用不同处理方式,宏观层面获取区域出行特征,中观层面明确线网特点,微观层面深入每个个体出行行为,统一各层面研究基础,避免研究前后的矛盾,形成一维多体的分析技术体系。
(二)研究成果更为准确与高效
在传统交通规划分析研究过程中,规划师与其他分析人员往往受限于传统计量模型与调研方式,难以避免其中带来的误差与人力物力的大量投入。大数据交通规划方法通过全样本数据的使用,部分脱离了对传统统计模型的依赖,从而规避了使用传统统计方法不可避免的误差。在出行特征方面,使用大数据手段通过手机信令数据,直接获取个体的出行特征,取代传统通过抽样调查、模型推导获得出行特征的办法。研究避免了抽样调查带来的偶然性,使得规划结果更为精准。
另一方面,大数据手段通过对大数据的重复使用与挖掘,减少了规划前期调研阶段对人力、物力、时间的投入,提供了更为高效的规划方法。在此背景下,时间的富余为方案的优化、误差的规避提供了足够的空间,从而将效率的提升转而促进质量的提高。
(三)更多的视角与更新的观察能力
面对不断复杂化的社会条件,传统交通规划往往畏惧于城市复杂特征,与城市精细化管理的发展方向格格不入。大数据手段的出现为交通规划提供了一种多角度、多层次、多测度的全样本连续观察能力。这种观察视角与观察能力对于准确把握交通规划问题的本质、深入剖析研究对象有着极其重要的意义。
全样本数据形成了基于每个研究对象的细分组群,研究其不同的出行特点,实现规划研究的以人为本。图1显示了上海市杨浦区五角场地区工作日全出行方式的出行量分布情况,利用3个月移动通信数据与公交卡刷卡数据进行分析研究,明确了各条道路的交通出行特征。庞大的数据量反映了居民与城市各功能空间之间的关系,提供了研究不同角度与层次的不同角度。
三、大数据的现实与理论困境
面对大数据在各个方面所产生的深远意义,无论是规划师、研究者还是政府主管部门均对大数据手段在交通规划中的应用抱有较大期待,希望能够通过大数据手段挖掘以往难以发现的问题,为规划研究提供更为丰富的角度,但实践中大数据在交通规划领域的应用仍存在大量的显示与理论的困境。无论是数据来源、数据的可信度、大数据规划方法的理论基础还是数据本身的挖掘方式都存在着较大的改进空间。针对同一地区的大数据交通规划研究存在着截然相反的研究结论,部分研究结论带有显著性错误。
(一)“全样本”的有偏性
受限于数据获取的途径,交通规划领域使用的大数据往往存在系统性缺失,不能真正代表“全样本”数据。如交通规划中常用的手机信令数据就存在着同一个体拥有不同手机信号的普遍情况,老年人与孩童不使用手机等情况。手机信令数据在特定群体信息缺失的同时被当作全样本处理,使得规划研究成果难以顾及这些群体的出行需求,为规划带来偏差。
一方面,大数据的偏差来自数据的自身特点,选择了手机信令数据就不可避免忽视了非手机用户的出行情況,选择公交IC卡刷卡数据不可避免非公交卡乘客出行信息缺失情况,不同的大数据来源或多或少存在着样本的系统性缺失。另一方面,大数据偏差来源自数据的获取渠道。国内数据的主要获取渠道之一是为以百度、阿里为代表的互联网公司。作为以盈利为目的的企业,大数据的获取与应用往往基于商业视角,数据标准与规划需求存在差别。例如高德地图与百度地图POI兴趣点信息作为常用的大数据类型,其兴趣点的种类与分类标准往往基于商业服务的对象,与城市规划、交通规划中的分类标准存在差异。缺乏商业价值的信息,则会带来大数据的偏差。
(二)基础理论的缺失
年轻的学科与研究方法一般都缺乏广受认可的基础理论,缺乏对于各类猜想的实证研究,大数据也是如此。因基础理论的缺失,使得规划编制过程中往往存在着规划指标混乱,成果权威性缺失,数据挖掘深度不足等情况。
针对交通拥堵情况,不同研究机构基于不同的大数据来源,通过不同的指标形成了完全不同的评价结果。在滴滴媒体研究院发布的《中国城市交通出行报告(2016年上半年)》中,2016年上半年最拥堵城市依次为石家庄、重庆、西安、济南、北京,然而在高德地图发布的《中国主要城市交通分析报告2016Q2》中,2016年上半年最为拥堵的城市依次为北京、哈尔滨、重庆、济南、杭州,两者存在较大偏差。在数据源方面,前者采用滴滴打车数据,后者采用高德导航数据;在指标体系方面前者使用畅通车速与高峰车速的比值,后者采用高峰的通行时间与畅通通行时间的比值。在缺乏广受认可的大数据研究标准情况下,大数据在交通规划领域的应用往往难以项目比较、项目校对并各自为政。
(三)数据管理的缺位
对于规划从业者与规划研究者而言,大数据在交通规划领域应用的另一瓶颈在于数据管理的缺位。一方面除了已在商业领域广泛使用的大数据类型与POI兴趣点等数据外,交通规划中所使用的大数据涉及居民的隐私与国家安全,缺乏专门的法律界定与规范信息时代下的个人隐私与国家安全。[8]另一方面,部分大数据的获取在受到政府的严格管理后往往时效性有所折扣,数据的获取门槛明晰,限制了大量学者进入大数据的交通规划领域研究。于此同时,虽然部分数据的获取在受到管制的同时却缺乏政府背书,使得基于此类数据的研究缺乏权威性。现阶段交通规划领域频繁使用的收集信令数据、公交卡刷卡数据、车载GPS数据主要为商业数据,在缺乏合理的法律规范、政府管理的情况下,数据的真实性与倾向性往往容易招致质疑,不利于规划研究的展开与优化。 四、上海的应用与问题
自2011年起,上海已逐步将大数据方法应用于交通规划过程中,但目前上海交通规划中对大数据的应用仍处于起步阶段,数据来源较为缺乏,挖掘深度有所不足,数据结果的公信力不高是现阶段上海交通规划中大数据应用的主要问题。即便如此,上海交通规划编制过程中仍不断尝试使用大数据方法,改进原有数据获取与处理办法,以希望更精确、更快速获取交通现状、梳理城市交通问题,并方便形成对过往交通问题的追踪评价。
(一)大数据在上海交通规划中的应用
目前,上海交通规划中对于大数据的应用主要体现在出行特征获取、公交特征获取以及对过往问题的追溯方面,数据来源以手机信令数据与公交IC卡刷卡数据为主。
传统交通规划中一般采用问卷调查、流量统计等方法,通过抽样调查获得OD矩阵、吸引量分布等出行特征。随着大数据手段的使用,上海在各类交通规划项目中逐步使用大数据手段取代部分传统抽样调查获取交通出行特征。在五角场城市副中心综合交通示范区的研究、崇明综合交通规划等多个项目中,规划师使用手机信令数据作为研究的基础,通过分析不同时段手机信号的位置、停留时间、重复出现的次数,获得各个分析单元的到发与过境情况,从而明确项目地的实际出行需求,明确各类交通出行方式的结构特征,构建OD矩阵。在交叉对比其他传统规划信息的基础上,实现对出行特征的精准把握。
在研究五角场交通现状的过程中,通过综合手机信令数据与公交卡刷卡数据,快速获取五角场各区域工作日与周末到发量特征,确定各片区出行密度差异。在出行方式方面,明确了不同片区的公共交通与小汽车出行比例,发现江湾居住区公共交通出行比例远低于五角场核心区的结构特征,从而确定了五角场周边交通拥堵的原因(图2~4)。
在历年的《上海市公交客流调查专题报告》中,依托公交卡刷卡数据、公交车载GPS数据、手机信令数据,获得了研究公共交通问题更高的视野,全面了解上海1 000多条公交线路逐站客流情况与运行速度,并实现对公共交通出行特征的准确梳理。通过不断挖掘具有潜力的公交走廊,优化全市公共交通网络,为上海市公共交通体系优化提升提供精准支持(图5)。
大数据在使用过后仍有较高的可挖掘价值。自使用大数据工具以来,上海市对公共汽车运行速度、线路逐站客流量、中心城区居民出行特征进行了持续调查,逐年形成专题研究报告,并改变传统仅仅回顾过往交通发展报告的情况,通过对过往数据挖掘,实现对交通发展历程的数据梳理、持续追踪。
(二)规划实践中的问题
上海交通规划的大数据实践过程也不可避免地面对各种各样的问题,一部分源自大数据自身的现实与理论困境,另一部分源自规划思维方式未能及时转变。正如大数据研究方法自身的现实与理论困境中所描述的,上海交通规划的大数据实践也同样面对着“全样本”的有偏性、基础理论缺失、官方数据的垄断瓶颈等问题。
规划中往往因大数据样本的系统性偏差、数据来源缺乏具有公信力的机构背书、数据分析方法缺乏扎实的理论基础,使得部分依托大数据手段获取的交通出行特征分布成果存在争议,与常识不符。在崇明综合交通规划研究中,规划师通过手机信令数据分析获取的交通出行特征与常识不符,与通过传统研究方法获得出行特征存在矛盾。为项目的完善与推进带来了障碍。
在方法创新方面,上海交通规划的大数据实践过程往往仅将大数据分析手法用于分析获得现状出行方式、出行特征等方面。通过大数据手段优化提升传统研究方法的精度与规划项目的工作效率,暂未提供新的研究视角与预测方式,大数据分析方法的价值主要体现在工作过程之中,未能在成果上得到充分体现。
在数据获取上,上海交通规划领域常用的手机信令数据与公交刷卡数据因隐私保护与数据安全原因,获取的数据往往源自过往一年,交通规划中的大数据研究难以获得即时的数据支持,为研究的深化与完善带来隐患,也使得交通规划研究难以及时发现问题。
五、总结与反思
近年来,将大数据手段不断引入交通规划领域并不断深化已是必然发展趋势。正如上海、北京、深圳等城市通过大数据手段对交通规划开展的实践,大数据对于传统交通规划的现状调研手段的匮乏、研究数据的不足有着极大的改善。但与此同时,我们也逐渐看到现阶段大数据在交通规划领域发展的先天与后天不足。无论是数据本身的偏差还是基础理论的缺失、研究方法与标准的不统一,都促使每一个从业人员在当下面对这份不成熟与不足的大数据时需要保持谨慎,避免因为盲目轻信而陷入数据陷阱。
对于大数据发展本身,规划从业人员、学者与政府需要通力合作,不断从数据来源、数据获取方式、数据的质量等多个层面优化大数据市场,构建一个具有政府背书、高质量、高开放程度的大数据平台,克服当下规划研究的数据困境。同时,不断深化研究,构建基于大数据的规划理论基础,在为大数据在交通规划中的应用提供理论支撑的同时,丰富可供研究与挖掘数据的种类。
参考文献:
迈尔-舍恩伯格,库克耶,盛杨燕,等.大数据时代:生活、工作与思维的大变革:Big data a revolution : that will transform how we live, work, and think[M].杭州:浙江人民出版社,2013.
龙瀛,孙立君,陶遂.基于公共交通智能卡数据的城市研究综述[J].城市规划学刊,2015(3):70-77.
龙瀛,崔承印,张宇,等.利用公交一卡通刷卡数据评价北京职住分离的空间差异[C]//2012中国城市规划年会.2012.
杨东援.通过大数据促进城市交通规划理论的变革[J].城市交通,2016,14(3):72-80.
张天然.基于手机信令数据的上海市域职住空间分析[J].城市交通,2016,14(1):15-23.
丁亮,钮心毅,宋小冬.上海中心城就业中心体系测度——基于手机信令数据的研究[J].地理学报,2016,71(3):484-499.
張品立.大数据环境下的城市交通规划与管理模式变革——以上海智能化的公交集群调度为例[J].上海城市管理,2015,24(6):51-55.
李翔敏,戴帅.对基于大数据道路交通管理的冷思考:“小”即是美[C]//2015年中国城市交通规划年会暨第28次学术研讨会.2015.
责任编辑:许 丹
引言
2009年,google公司通过比对2003年至2008年季节性流感传播时期的搜索数据,成功预测了甲型H1N1型流感的传染情况,开启了时代对于大数据的认知。在我国,2013年被称为大数据元年,2014年大数据概念被写入《政府工作报告》,作为一项基础性战略资源,进入城市规划、交通规划等多个领域。
近年来,大数据(Big Data)概念的火爆与互联网热潮的发展有着密不可分的關系,各行各业均产生了不少基于“大数据”概念的实践行动,交通规划也不例外。但在热潮的背后,“大数据”的基本概念和内涵特点仍众说纷纭,未能形成统一的认识,涉及大数据概念的研究往往数量庞大却众说纷纭,大数据概念的不同理解也带来研究与实践的差异。对此,笔者倾向于通过数据特征与价值取向两个方面界定大数据概念,并以此为基础展开对“大数据”在交通规划领域的思考。
一、“大数据”概念及其规划应用
笔者认为,大数据概念包含两个主要特征。从数据的特征来看,大数据的数据选取往往无限接近于研究对象的全样本。方法上改变传统依托少量数据并利用统计学办法获得最多信息的做法,研究准确度上避免了样本选取带来的必然误差。值得注意的是,全样本的数据特征不是一个数据的数量概念,而是指数据与研究对象全体的相对关系。因而一旦研究的数据对象不能视为研究对象的整体,纵使研究的数据量非常庞大,仍不能算作利用大数据的研究办法。
从研究的价值取向来看,大数据的研究往往更多注重于研究内容的时效性与对未来的预见性。[1]在数据越来越多的情况下,使用全样本的数据往往需要付出一定的代价,即错误数据的获取。对于传统研究方法,因统计的数据量较少,些许错误的数据容易造成极大的研究误差,故而研究在数据获取与清洗过程中往往花费大量的时间,力求数据的精准。大数据方法与此不同,全样本的获取与庞大的数据量必然带来错误的数据内容,但错误的数据与内容在全样本中占比比较小,在适度的清洗下,部分牺牲结果的精确性能够有效提升大数据研究的时效性,提供连贯的、高频率的研究结果,并利用数据的相关性实现对未来的预见。
大数据方法在城市规划与交通规划领域,已有大量研究成果。如龙瀛团队对北京公共交通使用情况、[2]职住平衡等多方面的研究,利用公交卡刷卡数据基于数据增强设计方法,获取并挖掘北京市公共交通不同使用人群、不同使用时间的不同特征;[3]杨东媛教授对于使用大数据变革交通规划理论的探索,尝试通过建立在理论基础上的决策、判断、概念框架,将大数据分析技术、模型、方法纳入统一分析模板,提供一个新型理论框架。[4]在规划实践中,上海市城市规划设计研究院、上海城市交通设计院、北京交通发展研究院等北京、上海、广州、深圳城市规划、交通规划从业人员也已逐步通过使用公交卡数据、手机信令数据作为大数据研究的基础,为各类城市规划、交通规划作支撑。例如张天然利用手机信令数据对上海市市域职住空间的分析,[5]丁亮、钮心毅、宋小冬对上海市就业中心体系的研究等。[6]
从参与团队的性质来看,大数据在交通规划中的参与团队主要包含3类,以百度、阿里为代表的互联网企业,作为大数据的生产与处理方,生产了POI兴趣点数据、道路拥堵数据等大数据分析常用数据,提供了基于智慧城市平台的智慧交通解决方案,并出台基于自身数据平台的研究报告;以交通设计院、规划设计院为代表的规划设计与规划研究机构,作为大数据的应用与挖掘方,将大数据挖掘的成果直接应用于各类规划项目之中;以大学、研究院为代表的交通研究机构,作为大数据研究方法的探索方,尝试各类研究模型与研究方法,为大数据在交通规划中的应用提供理论基础。
从现有研究内容与规划方法上看,目前大数据在交通规划中的应用往往体现研究数据的全样本特征,无论是使用全年的公交卡刷卡数据还是利用手机信令数据,均尝试通过全样本数据研究交通特征,实现对规划决策的支撑。[7]然而针对大数据分析所带来的及时性特点则少有涉及,仅百度、阿里等商业性公司提供的交通拥堵预测服务具有及时性特点。笔者认为,此种情况的产生主要源自交通规划现阶段的自身特征。交通规划作为一项具有延续性的公共政策,不同于商业领域的应用,应具有合法性、权威性、延续性,即规划成果的内容需经过法定程序从而获得合法性,并伴随着政府的强制力获得权威性。这使得传统交通规划难以利用大数据时效性特征,实现对交通问题的及时反馈、实时追踪、问题预警。
二、“大数据”的技术变革
大数据方法不仅优化了传统交通规划的数据方法,实现了规划方法的量变,更从规划效果与研究视角上实现了质的变化,并将在未来提供更多的可能。从规划研究与规划实践来看,大数据的应用正从三个方面改变传统交通规划的编制。
(一)研究方法统一宏观至微观层面 传统研究交通规划往往使用抽样调查的办法研究规划项目,因工作量的差异,不同层面交通规划往往需要不同调查。不同的时间、日期、人员乃至方法,为不同尺度的规划项目带来了误差与矛盾,难以实现对同一区域宏观至微观的统筹。
大数据手段不同于抽样调查,能够将传统研究样本扩展到研究区域的每个个体,并在数据处理层面实现宏观至微观的分层,从而实现对宏观、中观、微观的全面统筹。依托同一数据源,针对不同需求使用不同处理方式,宏观层面获取区域出行特征,中观层面明确线网特点,微观层面深入每个个体出行行为,统一各层面研究基础,避免研究前后的矛盾,形成一维多体的分析技术体系。
(二)研究成果更为准确与高效
在传统交通规划分析研究过程中,规划师与其他分析人员往往受限于传统计量模型与调研方式,难以避免其中带来的误差与人力物力的大量投入。大数据交通规划方法通过全样本数据的使用,部分脱离了对传统统计模型的依赖,从而规避了使用传统统计方法不可避免的误差。在出行特征方面,使用大数据手段通过手机信令数据,直接获取个体的出行特征,取代传统通过抽样调查、模型推导获得出行特征的办法。研究避免了抽样调查带来的偶然性,使得规划结果更为精准。
另一方面,大数据手段通过对大数据的重复使用与挖掘,减少了规划前期调研阶段对人力、物力、时间的投入,提供了更为高效的规划方法。在此背景下,时间的富余为方案的优化、误差的规避提供了足够的空间,从而将效率的提升转而促进质量的提高。
(三)更多的视角与更新的观察能力
面对不断复杂化的社会条件,传统交通规划往往畏惧于城市复杂特征,与城市精细化管理的发展方向格格不入。大数据手段的出现为交通规划提供了一种多角度、多层次、多测度的全样本连续观察能力。这种观察视角与观察能力对于准确把握交通规划问题的本质、深入剖析研究对象有着极其重要的意义。
全样本数据形成了基于每个研究对象的细分组群,研究其不同的出行特点,实现规划研究的以人为本。图1显示了上海市杨浦区五角场地区工作日全出行方式的出行量分布情况,利用3个月移动通信数据与公交卡刷卡数据进行分析研究,明确了各条道路的交通出行特征。庞大的数据量反映了居民与城市各功能空间之间的关系,提供了研究不同角度与层次的不同角度。
三、大数据的现实与理论困境
面对大数据在各个方面所产生的深远意义,无论是规划师、研究者还是政府主管部门均对大数据手段在交通规划中的应用抱有较大期待,希望能够通过大数据手段挖掘以往难以发现的问题,为规划研究提供更为丰富的角度,但实践中大数据在交通规划领域的应用仍存在大量的显示与理论的困境。无论是数据来源、数据的可信度、大数据规划方法的理论基础还是数据本身的挖掘方式都存在着较大的改进空间。针对同一地区的大数据交通规划研究存在着截然相反的研究结论,部分研究结论带有显著性错误。
(一)“全样本”的有偏性
受限于数据获取的途径,交通规划领域使用的大数据往往存在系统性缺失,不能真正代表“全样本”数据。如交通规划中常用的手机信令数据就存在着同一个体拥有不同手机信号的普遍情况,老年人与孩童不使用手机等情况。手机信令数据在特定群体信息缺失的同时被当作全样本处理,使得规划研究成果难以顾及这些群体的出行需求,为规划带来偏差。
一方面,大数据的偏差来自数据的自身特点,选择了手机信令数据就不可避免忽视了非手机用户的出行情況,选择公交IC卡刷卡数据不可避免非公交卡乘客出行信息缺失情况,不同的大数据来源或多或少存在着样本的系统性缺失。另一方面,大数据偏差来源自数据的获取渠道。国内数据的主要获取渠道之一是为以百度、阿里为代表的互联网公司。作为以盈利为目的的企业,大数据的获取与应用往往基于商业视角,数据标准与规划需求存在差别。例如高德地图与百度地图POI兴趣点信息作为常用的大数据类型,其兴趣点的种类与分类标准往往基于商业服务的对象,与城市规划、交通规划中的分类标准存在差异。缺乏商业价值的信息,则会带来大数据的偏差。
(二)基础理论的缺失
年轻的学科与研究方法一般都缺乏广受认可的基础理论,缺乏对于各类猜想的实证研究,大数据也是如此。因基础理论的缺失,使得规划编制过程中往往存在着规划指标混乱,成果权威性缺失,数据挖掘深度不足等情况。
针对交通拥堵情况,不同研究机构基于不同的大数据来源,通过不同的指标形成了完全不同的评价结果。在滴滴媒体研究院发布的《中国城市交通出行报告(2016年上半年)》中,2016年上半年最拥堵城市依次为石家庄、重庆、西安、济南、北京,然而在高德地图发布的《中国主要城市交通分析报告2016Q2》中,2016年上半年最为拥堵的城市依次为北京、哈尔滨、重庆、济南、杭州,两者存在较大偏差。在数据源方面,前者采用滴滴打车数据,后者采用高德导航数据;在指标体系方面前者使用畅通车速与高峰车速的比值,后者采用高峰的通行时间与畅通通行时间的比值。在缺乏广受认可的大数据研究标准情况下,大数据在交通规划领域的应用往往难以项目比较、项目校对并各自为政。
(三)数据管理的缺位
对于规划从业者与规划研究者而言,大数据在交通规划领域应用的另一瓶颈在于数据管理的缺位。一方面除了已在商业领域广泛使用的大数据类型与POI兴趣点等数据外,交通规划中所使用的大数据涉及居民的隐私与国家安全,缺乏专门的法律界定与规范信息时代下的个人隐私与国家安全。[8]另一方面,部分大数据的获取在受到政府的严格管理后往往时效性有所折扣,数据的获取门槛明晰,限制了大量学者进入大数据的交通规划领域研究。于此同时,虽然部分数据的获取在受到管制的同时却缺乏政府背书,使得基于此类数据的研究缺乏权威性。现阶段交通规划领域频繁使用的收集信令数据、公交卡刷卡数据、车载GPS数据主要为商业数据,在缺乏合理的法律规范、政府管理的情况下,数据的真实性与倾向性往往容易招致质疑,不利于规划研究的展开与优化。 四、上海的应用与问题
自2011年起,上海已逐步将大数据方法应用于交通规划过程中,但目前上海交通规划中对大数据的应用仍处于起步阶段,数据来源较为缺乏,挖掘深度有所不足,数据结果的公信力不高是现阶段上海交通规划中大数据应用的主要问题。即便如此,上海交通规划编制过程中仍不断尝试使用大数据方法,改进原有数据获取与处理办法,以希望更精确、更快速获取交通现状、梳理城市交通问题,并方便形成对过往交通问题的追踪评价。
(一)大数据在上海交通规划中的应用
目前,上海交通规划中对于大数据的应用主要体现在出行特征获取、公交特征获取以及对过往问题的追溯方面,数据来源以手机信令数据与公交IC卡刷卡数据为主。
传统交通规划中一般采用问卷调查、流量统计等方法,通过抽样调查获得OD矩阵、吸引量分布等出行特征。随着大数据手段的使用,上海在各类交通规划项目中逐步使用大数据手段取代部分传统抽样调查获取交通出行特征。在五角场城市副中心综合交通示范区的研究、崇明综合交通规划等多个项目中,规划师使用手机信令数据作为研究的基础,通过分析不同时段手机信号的位置、停留时间、重复出现的次数,获得各个分析单元的到发与过境情况,从而明确项目地的实际出行需求,明确各类交通出行方式的结构特征,构建OD矩阵。在交叉对比其他传统规划信息的基础上,实现对出行特征的精准把握。
在研究五角场交通现状的过程中,通过综合手机信令数据与公交卡刷卡数据,快速获取五角场各区域工作日与周末到发量特征,确定各片区出行密度差异。在出行方式方面,明确了不同片区的公共交通与小汽车出行比例,发现江湾居住区公共交通出行比例远低于五角场核心区的结构特征,从而确定了五角场周边交通拥堵的原因(图2~4)。
在历年的《上海市公交客流调查专题报告》中,依托公交卡刷卡数据、公交车载GPS数据、手机信令数据,获得了研究公共交通问题更高的视野,全面了解上海1 000多条公交线路逐站客流情况与运行速度,并实现对公共交通出行特征的准确梳理。通过不断挖掘具有潜力的公交走廊,优化全市公共交通网络,为上海市公共交通体系优化提升提供精准支持(图5)。
大数据在使用过后仍有较高的可挖掘价值。自使用大数据工具以来,上海市对公共汽车运行速度、线路逐站客流量、中心城区居民出行特征进行了持续调查,逐年形成专题研究报告,并改变传统仅仅回顾过往交通发展报告的情况,通过对过往数据挖掘,实现对交通发展历程的数据梳理、持续追踪。
(二)规划实践中的问题
上海交通规划的大数据实践过程也不可避免地面对各种各样的问题,一部分源自大数据自身的现实与理论困境,另一部分源自规划思维方式未能及时转变。正如大数据研究方法自身的现实与理论困境中所描述的,上海交通规划的大数据实践也同样面对着“全样本”的有偏性、基础理论缺失、官方数据的垄断瓶颈等问题。
规划中往往因大数据样本的系统性偏差、数据来源缺乏具有公信力的机构背书、数据分析方法缺乏扎实的理论基础,使得部分依托大数据手段获取的交通出行特征分布成果存在争议,与常识不符。在崇明综合交通规划研究中,规划师通过手机信令数据分析获取的交通出行特征与常识不符,与通过传统研究方法获得出行特征存在矛盾。为项目的完善与推进带来了障碍。
在方法创新方面,上海交通规划的大数据实践过程往往仅将大数据分析手法用于分析获得现状出行方式、出行特征等方面。通过大数据手段优化提升传统研究方法的精度与规划项目的工作效率,暂未提供新的研究视角与预测方式,大数据分析方法的价值主要体现在工作过程之中,未能在成果上得到充分体现。
在数据获取上,上海交通规划领域常用的手机信令数据与公交刷卡数据因隐私保护与数据安全原因,获取的数据往往源自过往一年,交通规划中的大数据研究难以获得即时的数据支持,为研究的深化与完善带来隐患,也使得交通规划研究难以及时发现问题。
五、总结与反思
近年来,将大数据手段不断引入交通规划领域并不断深化已是必然发展趋势。正如上海、北京、深圳等城市通过大数据手段对交通规划开展的实践,大数据对于传统交通规划的现状调研手段的匮乏、研究数据的不足有着极大的改善。但与此同时,我们也逐渐看到现阶段大数据在交通规划领域发展的先天与后天不足。无论是数据本身的偏差还是基础理论的缺失、研究方法与标准的不统一,都促使每一个从业人员在当下面对这份不成熟与不足的大数据时需要保持谨慎,避免因为盲目轻信而陷入数据陷阱。
对于大数据发展本身,规划从业人员、学者与政府需要通力合作,不断从数据来源、数据获取方式、数据的质量等多个层面优化大数据市场,构建一个具有政府背书、高质量、高开放程度的大数据平台,克服当下规划研究的数据困境。同时,不断深化研究,构建基于大数据的规划理论基础,在为大数据在交通规划中的应用提供理论支撑的同时,丰富可供研究与挖掘数据的种类。
参考文献:
迈尔-舍恩伯格,库克耶,盛杨燕,等.大数据时代:生活、工作与思维的大变革:Big data a revolution : that will transform how we live, work, and think[M].杭州:浙江人民出版社,2013.
龙瀛,孙立君,陶遂.基于公共交通智能卡数据的城市研究综述[J].城市规划学刊,2015(3):70-77.
龙瀛,崔承印,张宇,等.利用公交一卡通刷卡数据评价北京职住分离的空间差异[C]//2012中国城市规划年会.2012.
杨东援.通过大数据促进城市交通规划理论的变革[J].城市交通,2016,14(3):72-80.
张天然.基于手机信令数据的上海市域职住空间分析[J].城市交通,2016,14(1):15-23.
丁亮,钮心毅,宋小冬.上海中心城就业中心体系测度——基于手机信令数据的研究[J].地理学报,2016,71(3):484-499.
張品立.大数据环境下的城市交通规划与管理模式变革——以上海智能化的公交集群调度为例[J].上海城市管理,2015,24(6):51-55.
李翔敏,戴帅.对基于大数据道路交通管理的冷思考:“小”即是美[C]//2015年中国城市交通规划年会暨第28次学术研讨会.2015.
责任编辑:许 丹