基于时序特征的轨迹数据清洗研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:leng36318
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传感器、网络、定位等技术日益发展,各类定位设备被广泛应用,产生了大量的轨迹数据。这些数据反映了移动对象的活动特点,在城市规划、商业决策、交通监测等领域都具有很高的研究和应用价值。然而,轨迹数据的采集、传输、存储、处理等步骤都可能出错,为数据引入噪声,干扰后续的研究与应用,因此需要预先进行噪声清洗。现有轨迹噪声清洗方法在处理异常轨迹和配合领域知识上存在问题。一方面,异常轨迹常常被当成噪声一并加以检测和修复,严重影响后续对异常轨迹的处理、研究和应用,如何区分轨迹噪声和异常轨迹是研究中的难题。另一方面,领域专家难以将与运动相关的领域知识应用于清洗过程,也难以根据领域知识可解释地调整清洗方法来适应不同的轨迹数据集。针对上述问题,本文探索了保留异常轨迹的噪声清洗原理和方法,并在此过程中将可解释性与领域知识的利用放在同样重要的位置上。主要贡献包括:(1)提出了一种轨迹数据时序特征提取算法,该算法基于轨迹数据时序关系的局部性特点,将轨迹片段提取为一系列可解释的特征数据,便于领域专家的理解与描述,并更好地利用领域知识;(2)设计了一种保留异常轨迹的噪声清洗模型,基于从轨迹数据中提取的时序特征,结合本地与全局的逻辑关系做出噪声或异常的判断,并给出噪声的修复建议;(3)本文的模型和算法是数据驱动的,不依赖于路网数据等额外的标准化信息,具有较强的通用性;(4)模型中的权重参数具有较强的可解释性,有助于领域专家根据领域知识清洗不同的数据集。论文的实验研究验证了所设计的算法与模型的有效性。
其他文献
随着强磁场技术的快速发展,强磁场下Fe-C合金固态相变逐渐引起了材料研究者的关注。尤其是强磁场下的Fe-C合金扩散型固态相变的组织演化机制成为研究热点之一。因此,本文选择Fe-0.155%C合金和Fe-0.494%C合金为研究对象,通过改变奥氏体化温度、磁场作用时间、磁感应强度以及磁场梯度等参数,进行无磁场、均恒磁场和梯度磁场下热处理退火实验研究。并借助金相显微镜、EBSD和拉伸等检测手段,研究了
LNG储罐长期服役在-162℃的极低温环境下,储罐材料需具备良好的低温韧性、高强塑性、优良焊接性能等。目前,LNG储罐材料多采用9%Ni钢、奥氏体不锈钢、铝合金以及殷瓦钢。高锰钢由于具有低成本、高强度、高塑性和良好的低温韧性的优点,使其在LNG储罐上的应用具有巨大潜力。近年,韩国已经成功开发出了高锰低温容器用钢以及配套的焊材,并写入了 ASTM标准,而国内LNG储罐用高Mn奥氏体钢的研究尚处于起步
自进入新世纪以来,电磁污染日趋严重,被世界环卫组织列为仅次于水,电,噪声之后的世界第四大污染源。全球每年因电磁污染对一些电子仪器设施造成的损伤达到数十亿美元以上,而且对人体的损伤更是不可估量。因此,吸波材料的研发一直是一个焦点话题。随着材料科学的发展,新型材料逐渐取代传统材料。石墨烯因为其电子迁移率高,密度小,是一种性能优越的介电损耗吸波材料,在众多碳材料中脱颖而出。本文利用石墨烯的大比表面积特征
近年来,伴随着互联网的高速发展,位置数据的价值显得尤为重要。现如今,基于位置服务的需求不断激增,无论是室外道路以及行程规划、大型商场的室内商铺导航,还是在工业、农业等生活领域外的其他领域,皆需要基于位置的服务。然而不同于发展较成熟的室外位置服务技术,室内复杂的空间状况使其无法应用现有的室外服务技术。国内对于室内位置服务系统的研究相比于国外起步较晚,研究程度也略显不足,因此,设计并开发一套完整的室内
淮山(Dioscorea opposita Thunb),又名山药,是我国备受消费者青睐的药食两用食物资源,具有重要的营养和经济价值。淀粉是淮山中主要营养物质,由于作物品种和生长环境的不同,天然淀粉颗粒的性质具有很大的差异,而目前关于南方的淮山淀粉的特性研究还比较少。因此,论文以木薯、红薯、香芋淀粉为对照,选择了9个具有南方特色的淮山淀粉品种为研究对象,对其加工性质、流变性质、凝胶质构特性、热力学
自由空间光通信(Free Space Optical Communication,FSOC)是一种以激光为载体,大气为信道的无线通信。尽管FSOC有成本较低,不需要铺设链路,传输速率快,节省空间等优点,但FSOC会受到大气环境的影响,降低通信质量。自适应光学(Adaptive Optics,AO)是一种可以实时捕获光束,监测由于大气湍流产生的波前像差,并通过算法对波前像差进行校正的技术。其中非波前
三维多通道交互是一种更贴近现实世界认知的交互方式,支持多种输入输出设备,能满足不同用户群体的交互需求,在医疗、教育等领域得到了广泛的应用。通过三维多通道用户界面,人们可以更加方便地执行操作任务和感知系统状态,在交互的过程中有更强的沉浸感和真实感。因此,研究以用户为中心的三维多通道界面设计具有重要的实际价值和意义。由此产生两个亟待解决的问题:三维多通道用户界面缺乏统一的界面范式,给界面开发带来了困难
高可靠低时延通信(ultra-reliable and low-latency communications,URLLC)是5G三大核心应用场景之一,主要用于承载工业自动化、自动驾驶、远程医疗等新型业务。URLLC要求传输时延在1ms以内的可靠性达到99.999%。支撑这种对时延Qo S(quality of service)及可靠性要求极其严苛的业务对MTC(machine type commu
石油天然气作为我国重要的能源在各行各业都起到不可或缺的作用。地震勘探是油气资源探查的有效手段,受到地震勘探采集环境和采集仪器的影响,采集到的地震勘探数据往往带有大量的随机噪声,这些随机噪声湮灭了有效信号,降低了地震勘探数据的质量。沙漠地区采集的地震勘探数据中随机噪声不同于其他采集地区的随机噪声,往往具有非高斯、非平稳、非线性,与有效信号弱相似的特性,这些特性给沙漠地震勘探数据的噪声压制带来了挑战。
近些年来随着物联网的发展,互联网中的移动设备数量爆炸性的增长。然而传统的供电方式(例如,线缆供电和电池供电)已然成为了制约无线通信发展的重要因素。无线信息与能量同传技术(Simultaneous Wireless Information and Power Transfer,SWIPT)在这种环境下快速发展,其发射端通过发射携带信息的射频信号来给接收端传输能量和信息。多入多出(multiple i