基于大数据的深港口岸客流出行行为分析

来源 :武汉理工大学 | 被引量 : 2次 | 上传用户:wutiepeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着改革开放的不断发展,深圳和香港两地在文化和经济等多方面的交流日益深化,在交流不断深化的过程中,也存在着交通拥堵、水客走私和游客服务质量下降等诸多潜在的问题。本文基于Hadoop大数据平台,结合数据处理技术建立统一时空标准的数据库,从时间轴分析不同时段的口岸客流量,从空间轴分析不同人群的运动轨迹,通过时空数据挖掘技术,定量分析获取不同时段、不同人群在口岸区域的活动特征和规律,挖掘不同人群的出行行为模式,从而为优化城市智能交通管理、提高口岸运行效率和提高游客出行体验等方面提供相关的决策依据。本文的主要研究工作有以下几个方面:(1)利用数据预处理技术完成公共交通数据的数据融合,并结合时空挖掘技术对口岸客流进行人群划分和模式分析。依托大数据平台去除车辆GPS数据漂移点,利用预处理后的数据分析客流时空特征,并提取相应特征基于层次聚类算法对口岸客流进行人群划分和模式分析。针对层次聚类在大数据量时运行效率缓慢的问题,提出先基于密度聚类再进行层次聚类的解决方法,并在进行密度聚类时一次合并多个相似点以提高算法效率。(2)利用抓取的香港基站数据和POI信息点(Point of Interest,即“兴趣点)为地区建立标签,并利用通信数据分析游客的时空轨迹。利用地图标签分类方法将Google地图抓取到的香港POI数据划分为16个类别,并结合基站数据和相关公式对基站所在位置贴标签,另外利用一次性手机卡和基站信息融合后的数据从不同维度分别分析游客的时空运动轨迹。(3)结合聚类算法对游客出行目的地偏好进行细分。结合16类分类标签,建立游客各类标签出行时长消耗的特征向量,经过加权和降维,利用k-means聚类算法实现游客出行目的地偏好的划分,其中为避免局部最优解而提出基于密度优化选取初始聚类中心的改进算法,通过计算每个数据点的局部密度和该点到具有更高局部密度的点的距离,选择处于高密度的点作为初始聚类中心。之后根据商圈划分利用关联规则算法发现各大商圈之间的联系。本文通过多源数据分析深港口岸人群的活动特征和规律,对优化城市交通配置和提高游客服务质量等方面有一定的指导意义。
其他文献
会计师事务所与一般企业一样,需要控制其成本以提高绩效,而"通过分析企业价值链,制定出预算,进而通过预算实现对成本控制"的价值链预算可以铸造具有系统功能的"审计成本控制
在初中语文教学中,语文教师通常将教学重点放在教材课文研究上,忽略了课文、词语语言研究,限制了学生对语文语言的想象力,从而降低了语文课堂教学效果,背离了新课标对语文教学提出
随着信息时代的到来,网络上的信息越来越呈现出指数形式爆发增长的态势,在这其中,文本信息占据了相当重要的组成部分,如何准确高效的获取知识成为亟待解决的问题。实体识别和关系抽取的联合模型的主要目标是同时从非结构化的文本中抽取实体类别和它们之间的语义关系。作为自然语言处理技术的底层技术,对于上层的应用有着显著的意义。本文围绕着实体识别和关系抽取的联合模型进行了深入的研究,主要工作内容和阶段成果如下:(1
本文对目前空心锭-环锭花式捻线机控制系统进行了简要总结,提出了将神经网络控制算法应用于该控制系统的思想。叙述了神经网络的主要特点,分析了影响花式纱线的四个主要参数,
微信是近年流行的网络社交平台,研究其中体现的用户心理和群体心理效应对分析网络群体交流和微商推广有重要意义。近年迅速流行的微信抢红包现象极具社交参与性和娱乐性,研究
新探与界说:中国山水诗朱德发中国是个诗国,更是个山水诗大国,历代诗论付山水诗都有界定,尤其现代曾一度出现“山水诗讨论热”,众说纷纭,至今未取得共识。这是合乎学术发展现律的,也
当前互联网的迅速发展,加上智能手机的普及,微博、微信等已经成为社会生活中人际交往十分重要的即时互动交流平台,以新浪微博为例,作为我国当前快速发展的典型社交网站,它正日益成
报纸
IASB 2010年12月发布的套期会计征求意见稿首次提出了套期会计目标,简化了套期会计适用条件,增加了套期工具和被套期项目种类,充分体现了财务报告编制者对增加套期会计适用性
<正>以胡锦涛为总书记的中央领导集体,非常重视决策科学化、民主化问题。2004年9月党的十六届四中全会通过的《中共中央关于加强党的执政能力建设的决定》提出,"改革和完善决
简单介绍了小分子凝胶剂的定义及分类,重点介绍了氨基酸类和类固醇类小分子凝胶剂当前的研究进展。总结了小分子有机凝胶剂的应用价值及其研究中需要解决的几个基本问题。