低采样频率车辆GNSS轨迹异常数据检测方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:kiry250
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车辆GNSS(Global Navigation Satellite System)轨迹数据,是城市地理信息系统重要数据来源之一,在城市结构、城市规划、交通分析及居民出行等方面有巨大的应用前景。公共车辆的GNSS轨迹数据在城市地区具有覆盖面广、周期性好、数据量大等优点,但同时存在定位精度低、采样频率低、质量高低不一等缺点。数据滤波是轨迹数据挖掘不可缺少的前置处理过程,以往工作偏重单条轨迹处理及离群点识别,而对车辆轨迹中隐含的连续轨迹点的整体偏移情况和采样频率低导致的“假轨迹”严重偏离道路的情况重视不足。本文着重针对这两类异常进行深入研究,不依赖于路网等辅助数据,检测出整体偏移的连续轨迹点和低采样频率导致的低质量轨迹片段,以提高轨迹数据质量。本文的主要研究内容包括:  (1)针对公共车辆GNSS轨迹数据的时空特征,结合车辆移动特征与城市环境,对各异常数据的空间分布、时间间隔以及可能产生的原因,进行了较为详细的统计分析,并据此对轨迹数据的异常进行了定义和分类,即“团状”、“星状”、偏移异常、“假轨迹”线段四类。对“团状”和“星状”异常进行处理,去除大量冗余和滤除极端偏离点,在此基础上对后续两类异常数据进行检测。  (2)针对车辆GNSS轨迹中的连续轨迹点的整体偏移情况,提出一种基于核密度方法的识别模型进行检测。先沿待判断点方向的垂直方向做剖面,计算得到剖面上核密度空间分布,再利用朴素贝叶斯计算待判断点属于附近高密度峰值(潜在的道路位置)的概率,最后利用区间估计法进行异常检测。  (3)针对由采样时间间隔长导致的“假轨迹”线段,提出一种基于统计推断的线段识别模型进行检测。先利用基于信息熵的最大似然分类法判断线段端点的位置类型,再对端点方向和线段密度进行估算,最后基于推断模型检测异常线段。  本文以北京市2012年11月出租车数据为例,对上述方法进行了实验验证。数据集采样时间间隔为主要在10-60秒之间,发现团状、星状异常数据占数据集的32.21%,异常轨迹线段占6.23%,十分有效地去除了冗余,提高了数据质量,为轨迹数据时空挖掘奠定了基础。
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
区域可持续发展有赖于水资源的保障与支撑。近三十年来我国经济发展取得了辉煌成就,但日趋严峻的地区水资源危机也不容忽视。本文针对我国区域发展面临的水资源约束,应用自主构
︽红楼梦︾十三四回写了王熙凤协理宁国府的事秦可卿死了本来就弊病多端诸事无绪的宁国府值此丧事越发显得﹃着实不成体统﹄了贾正惟恐因之﹃亏了礼数怕人笑话﹄所以心
霍乱的暴发与流行受多种因素的影响,包括地理与气候环境、人群密度、媒介生物、病原体本身以及社会因素等。其在空间尺度上,由于环境差异大、影响因素多,而具有明显的区域性差异
数据同化方法作为一种优化融合地球观测信息和地学模型信息的重要方法论,在集成复杂地球系统的模型模拟和地球观测时代的多源观测信息方面扮演着重要角色。数据同化系统研究
乡村规划是控制农村居民点用地规模和布局的重要手段,特别是在地质灾害多发的山地环境下,农村居民点的合理规划不仅关系到农村土地利用结构的优化调整,在减灾避灾,确保群众生
我国是世界上土壤侵蚀最严重的国家之一,其范围遍及全国各地。从土壤侵蚀的定性研究到定量研究,遥感起着越来越重要的作用,然而不同传感器狭取的遥感数据之间存在差异,对土壤
凡是到过呼伦贝尔的人,不仅为那里的青山绿水和丰富资源而惊叹,更为那里扑面而来的文明气息所陶醉。要感受呼伦贝尔的精神文明,最具代表性的莫过于电力系统。呼伦贝尔电业局是一
期刊
优秀的文学作品大多含蓄隽永,耐人寻味。在语文教学中,教师要引导学生在细微处和不经意处停下目光,仔细寻觅僻静幽雅的胜景,从中获得一种新奇的体验,这就需要语文教师引领学生在文学作品中探幽揽胜。  一、 在多向思维中探幽揽胜  语文教学重在感悟、体验,鼓励百花齐放,要求学生对事物的思考能够独具慧眼,标新立异,但是又能够言之有理,这就需要多向思维。  教学中教师要寻找具有开发潜力的关键点,引导学生去品读文