基于MapReduce的城市交通出行分布异常检测和分析

被引量 : 6次 | 上传用户:jimlancer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时空轨迹数据挖掘的快速发展,轨迹数据异常值检测已成为数据挖掘领域的研究热点。传统的异常检测方法在检测轨迹数据异常值时很多都基于欧式空间环境,将异常值表示为远离大部分一定距离的点。但在交通事件应急响应等方面的实际应用中,交通出行分布异常的检测主要通过交通流量的变化进行判断,对传统异常检测算法中采用的欧式距离来度量异常的方法不再适用。此外,交通轨迹数据量庞大,使用传统的、单机运行的异常检测方法运行效率也较低。在本文中,利用MapReduce分布式并行计算框架,提出了一种基于MapReduce的分布式并行城市交通出行分布异常检测和分析算法。具体工作如下:(1)为了能更好的描述交通出行分布情况,本文提出了一种基于小区交通流量的城市交通出行分布模型。该模型较为简单且容易理解,能够从宏观上展现整个城市的交通出行分布状况。(2)针对交通出行分布异常检测问题,本文结合交通领域知识,在城市交通流量分布模型的基础之上提出了基于小区交通流量的交通出行分布异常定义,并给出了形式化的表示方法。(3)在上述工作基础之上,本文提出了一种基于MapReduce的分布式并行交通出行分布异常检测和分析算法(MapReduce-Based Distributed ParallelTransportation Distribution Outliers Detection And Analysis Algorithm,简称MDPTDODA)。该算法首先对出租车轨迹数据进行预处理,然后从出租车轨迹数据中提取经过小区之间的交通流量并建立基于小区交通流量的城市交通出行分布模型。最后整合该分布模型中连续多天的交通流量,构建时间序列集,通过DBSCAN聚类算法和动态时间扭曲距离(Dynamic Time Warping,简称DTW)进行交通出行分布异常检测,并根据异常之间的关系分析异常引起的可能原因。本文以北京市出租车历史轨迹数据作为原始数据,在单机多核环境和基于Hadoop的集群环境下分别对试验算法的单机版本和分布式并行版本进行了实验,证明了本文提出的MDPTDODA算法在分析处理大量轨迹数据时的高效性。同时,本文将实验结果与历史实际情况进行了对比,结果表明该方法在异常的检测和分析方面是有效的。
其他文献
炮制过程改变药性是中药的一大特点,地黄是炮制方法影响其药性的典型例子,其机理尚未清楚。从表观上观察,淡黄色的鲜地黄到黑如漆的熟地黄,发生了明显的褐变。究其原因应为美拉
近年来在我国发生的群体性事件中,有一类被称为“邻避事件”(“邻避”是英文“Not in my backyard”(“不要在我家后院”)首字母缩写(NIMBY)的中文名称),此类事件的肇因是政府等相
目的:评价粗针身柱穴透刺治疗帕金森病肌僵直的疗效。方法:将61例帕金森病患者随机分为粗针组和美多巴组,美多巴组服用美多巴1次125mg,每日4次;粗针组在服用同样剂量美多巴的
<正>"落实课标,大力普及中小学校器乐教学,让学生学会一件课堂乐器的演奏!"这句话"喊"了很多年。笔者注意到《义务教育音乐课程标准(2011年版)》(以下简称"课标")颁布以来,国
作为艺术的一个手段,黑白木刻版画也有着自身独特的艺术理解与表达观点的独特形式,朴实而颇多蕴藉,浑厚而不乏润泽。黑白木刻是有生命力的艺术,其锋芒毕露,打动人心,以强悍的
022Cr25Ni7Mo4N合金是超级双相不锈钢的典型代表,属第三代双相不锈钢。该合金具有以下特点:一是钢中Cr、Mo、Ni、N等合金元素含量均高于第二代双相不锈钢,耐应力腐蚀开裂性能和
刚才周济同志就我国教育改革和发展的总体情况作了重要讲话。其中就教育事业的改革和发展在世纪之交所取得的成就与产生的问题,新世纪我国教育改革和发展面临的新机遇、新挑战
目的探讨格列齐特在正糖环境中对小鼠成骨细胞样细胞MC3T3-E1增殖、分化及凋亡的影响方法体外培养小鼠成骨细胞样细胞MC3T3-E1,分为正常对照组和不同浓度格列齐特组(10μmol/
要想实现布袋除尘器脉冲清灰实际效果的不断优化与增强,有必要进一步研究其重要部件与参数。基于此,文中将脉冲喷吹式布袋除尘器清灰能力评价指标作为主要研究内容,阐述关键
现有损伤成像算法应用于真实复杂的航空结构时,由于结构的各向异性、复杂边界反射以及导波自身频散特性的影响,成像效果往往较差,应用时误差较大,甚至不能成像。针对上述问题