基于手机信令数据的数据清洗挖掘与居民职住空间分析

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:babyjoyce
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为所辖区域的政治、经济、文化中心,城市的发展能有力地带动周边区域的发展。城市中合理的居民职住空间规划能有效提高居民的生活质量与工作效率,是城市建设中不可或缺的一环。因此如何获取城市居民的人口密度以及职住空间分布是城市规划建设中的大问题,传统获取职住数据的方式主要为上门走访、发放调查问卷等人工方式,这些方式既消耗了大量的人力物力,又不能保证结果的准确性。随着时代的发展,一些较为先进的手段已经应用在了城市信息获取中,如电话访问调查,视频监控记录等,但这些方法不可避免地存在成本高、覆盖面小等缺点。目前,利用手机信令数据获取城市居民的职住空间分布是大数据时代下的研究热点,本文通过对手机信令数据进行清洗、挖掘、提取这一系列步骤,获取居民的职住空间分布信息。本文的工作主要体现在以下几个方面:在数据清洗方面,提出了对手机信令数据进行层次化清洗的原则:首先将信令数据视为常规数据,清洗其中包含的无效数据;随后针对手机信令数据的特点,清洗信令数据所特有的漂移数据;最后基于后续停留点提取的需求,提出一种经K-means聚类算法改良的LOF离群点检测算法,清洗影响停留点提取的轨迹点。经实验验证,该改良算法能够在不影响检测精度的前提下提高算法的效率。在数据挖掘方面,针对DBSCAN聚类算法不适合处理时空数据的缺陷,从聚类算法的基本概念入手,对其进行时间维度的语义扩充,使其适合手机信令数据的停留点提取;在停留点提取算法的参数确定方面,创新性地结合停留点的定义与数据源的特征,动态地确定算法的参数,简化了参数确定过程;最后,与经典的停留点提取算法对比,证明本文提出算法的优越性。在职住空间提取方面,首先对实验获取的停留点数据进行分析,得到其基本特征;随后结合资料设定了职住停留点划分的时间阈值,并设计了相应算法从停留点集合中提取职住停留点;最后,根据获取的停留点集合绘制居民职住分布热力图,并结合实际情况对热力图进行分析。
其他文献
工程建设的复杂性决定了工程建设管理模式的多样性,不同的模式存在不同的优缺点。文章在对多种工程项目管理模式对比分析的基础上,进行了不同模式的组合研究,尤其是对目前已
在人力资本、物质资本和货币资本中,人力资本作为知识经济时代企业最重要的生产要素,显示出越来越突出的地位。但是,许多企业还不明白人力资本是与企业战略息息相关,可以为企
近些年来,电子技术呈现出良好的发展趋势,这在某种程度上促进高速数字电路发展随之加快,形成相对完整的数据系统,以确保数据传输的准确性,从某种意义上而言,高速数字电路信号
城市商业中心空间活力有其自身的分布特征和等级评价,本文从人群活动角度探讨城市商业中心空间活力在空间和时间上的分布特征模式,提出能够反应空间活力等级的三个维度.本文
<正>临床免疫学检验是医学检验专业的一门重要的必修课,它是一门实践操性比较强的课程,为了使学生尽快理解并掌握临床免疫学检验的新知识和新技术,培养学生的动手操作能力及
文章从高校图书馆出发,具体分析了图书馆提高管理人员的素质、开展优质服务的内容,全面论述电子阅览室的服务模式以及实现电子文献资源有效管理的途径。
自1996年世界卫生组织提出"积极老龄化"以来,老年志愿服务组织的出现在一定程度上缓解了人口老龄化的压力。但由于我国老年志愿服务还尚处在起步阶段,所以本文通过对老年志愿
复合图书馆馆藏具有其自身的特点。因此在复合图书馆初级阶段,信息资源建设要以纸质文献为主,正确处理好书与刊的关系。数字化资源的建设应以存取为主,注重联合发展,并加强网
<正>互助县地处青藏高原气候带,具有独特的气候特征,日照时间长,昼夜温差大,气候冷凉、干燥多风、雨热同季,由于气候冷凉,病虫害发生少,地区工业排污少,大气、土壤水源无污染
本文对南京地区2015年的一次强降雪过程进行了湿位涡诊断分析,根据2008-2015年的57次强降雪个例归纳出了积雪效率与地面2m气温的关系。结果表明:湿位涡正压项对降雪强度变化有