论文部分内容阅读
本文对手机信令数据进行研究,在对蜂窝基站的定位原理、驻留点的聚类算法,通勤路线的提取算法进行研究之后,提出了基于密度的时间序列空间数据聚类方法和利用LCSS求解通勤路线的算法,研究了从手机信令数据中获取职住地的问题,并从中提取通勤路线。研究表明,本文提出的职住地提取方法利用手机信令数据中蕴含的时间序列信息,较准确地识别出用户的职住地灯场所和其间的通勤路线。其中提出的聚类算法和参数标定算法能够识别不同运动特征的用户职住地分布,具有较好的识别效果,为手机信令数据在地理背景下的研究和城市中个体的职住地分析,提供了有价值的探索。首先,本文通过对蜂窝基站定位方法的研究,分析了不同定位方法的优缺点,手机信令数据的误差来源。在此基础上对手机信令数据的预处理进行了深入地分析,给出了不同误差数据的处理方法和处理要求。其次,本文在对个人用户的手机信令数据进行了分析之后,从聚类的角度对手机信令数据中驻留点进行了分析。DBSCAN是一种基于密度的数据聚类算法,能够自动确定簇的数量,可应用与移动信令数据的驻留点分析。本文在DBSCAN的基础上,引入时间维参数,提出了一种针对时间序列数据的DBSCAN-T算法,使用自适应方法对算法参数进行自动标定,支持时间序列数据的聚类分析。最后,本文在驻留点簇的分析的结果上,根据职住地的属性规律,从时间的角度,运用KMeans聚类的方法对用户的职住地位置进行识别。在分析了用户的职住地分布情况后,对符合通勤规律的用户,通过LCSS算法计算出行路线的相似度,获取了用户的通勤路线。研究结果与真实数据对比表明,DBSCAN-T算法能够很好的识别出用户的职住地,误差在百米之内;LCSS算法能在职住地分析的基础上准确地提取出用户的通勤路线。