基于大数据的区域联系及调度需求研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:laoyu2030
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展和移动终端设备的普及,通信数据的体量呈爆炸式增长,这些数据蕴藏了极大的潜在价值,为研究城市空间理论和挖掘人类移动模式提供了可靠的数据保障。合理划分城市区域,并明确区域之间的联系,对城市规划有重要价值。明确用户出行需求可减轻交通系统负担,改善交通环境,为制定交通控制系统的调度策略提供重要依据。本文基于用户移动网络数据,针对区域划分及区域联系、用户出行需求进行了相关研究,具体如下:(1)区域划分及区域联系分析研究特征提取方法与聚类算法,对城市区域进行了划分,并提出了分析区域间联系的相关模型。首先,构建基站流量的时间序列,并对时间序列从统计学、时域、频域三个方面提取了54维特征。其次,运用k-means++算法得到基站的功能类别。结合基站的地理位置特征和基站的功能类别,进一步运用k-means++算法将城区划分成400个功能区。再次,调用百度地图API,获取各个区域的兴趣点(point of interest,POI)信息,对每个区域进行功能区判定,并与本文的分区结果进行对比,得到分区的平均准确率为77.7%。最后,考虑区域中人群的迁入量、迁出量以及区域间的距离,提出基于人口迁移的牛顿引力模型,对区域间的联系进行了分析,并在此基础上研究了区域的重要程度。(2)用户出行需求预测研究统计学和机器学习中的模型,对用户出行需求进行预测。首先,针对每条路线构建用户出行时间序列。为应对城市中复杂的道路结构,本文提出按照人群的出行频度,将路线分为三类:频繁路线、普通路线和稀疏路线。其次,对所有路线构建统计学中的自回归移动平均整合模型(Autoregressive Integrated Moving Average Model,ARIMA)。运用滑窗法对用户出行时间序列进行处理,构建训练集和测试集,并建立三种机器学习模型:支持向量回归(Support Vector Regression,SVR)、梯度提升树(Gradient Boosting Decision Tree,GBDT)、随机森林(Random Forest,RF)。上述四种模型建立之后,分别用其进行用户出行需求预测,即预测每条路线在各个时段的用户出行量。再次,选用平均绝对误差(Mean Absolute Error,MAE)和均方根误差(Root Mean Square Error,RMSE)作为误差指标,对比分析预测结果。结果表明,GBDT模型的预测性能最优,其频繁路线、普通路线和稀疏路线下的平均MAE、平均RMSE分别为(1.479,2.132)、(1.549,2.156)和(1.278,1.745)。最后,将预测结果进行可视化展示。
其他文献
杠杆分析是研究现代企业理财活动中的一个重要课题,本文先以图解方式介绍现代企业理财活动中的两种杠杆及其伴随着的杠杆风险,然后对杠杆分析的若干问题展开探讨。
进行共产主义道德教育必须联系当前各种现实的斗争,使学生从这些活生生的现实中,明确国家的方向与前途。在目前,就必须很好向学生进行以解放台湾为中心的爱国主义教育。在解
ERP的成本管理采用的是标准成本体系,标准成本体系是20世纪早期产生并被广泛应用的一种成本管理制度。标准成本体系并非是一种单纯的成本计算方法,它是把成本的计划、控制、
本文密切结合工程中复杂系统振动控制需要,将人工神经网络理论与振动主动控制技术相结合,以黑箱振动系统为对象,系统深入地开展了基于神经网络的振动智能辨识与控制理论的研
<正>从2008年下半年至今,尤其是2010年开始试题结构相对稳定,浙江高考文综共有12套试卷,包括历年的调测卷、正卷和2014年的参考卷。研究这些试题,一是有助于我们了解已考试题
本文根据灯芯绒织物绒毛、绒沟的凹凸效应和双层绒纬的结构特点,从利用各类纤维的不同染色性能,同类纤维通过工艺变化以及通过色织手法三个方面较全面的探讨了“双色手法”在
<正>2011版《品德与社会》课程标准将品德与社会的课程性质定位在:"在小学中高年级开设的一门以学生生活为基础、以学生良好品德形成为核心、促进学生社会性发展的综合课程。
且未出现产品卫生指标超标现象,原酒的优级品率由原来的10.7%上升为14.7%,经济效益持续快速增长,2004年12月份,实现销售收入同比增长132.68%。
财务模拟适度持续增长率是企业理财中的一个重要课题。本文首先通过四个财务比率指标的组合分析 ,然后分别提出如何建立企业适度持续增长率的稳态模型和非稳态模型 ,并对财务