基于机器学习的沥青路面感知数据异常状态辨识与修复

来源 :长安大学 | 被引量 : 0次 | 上传用户:smsyzgc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着交通工具的普及,如何提高路面质量成为研究的热点,各种因素的变化导致路面信息采集系统很容易出现故障,造成异常数据的出现,因此异常值的检测及修复十分有意义。随着数据挖掘技术的崛起,机器学习在路面异常数据的检测、修复中也取得了重大的突破,因此本文提出一种基于机器学习的沥青路面感知数据异常状态辨识与修复方法,并对其进行了深入研究。首先,构建沥青路面温湿度一维感知数据集,采用基于统计的算法:3σ准则、箱型图和t检验准则分别对一维温湿度数据进行异常值检测分析;之后根据一维数据构建二维特征向量,分别构建一阶差分和线性求和特征向量。利用局部异常因子算法(LOF)、K均值(K-Means)和单类支持向量机(Oneclass-SVM)对构建的二维特征向量进行异常值检测,通过异常值检测评价指标戴维森堡丁指数(DBI)对模型进行评价分析。利用DBI优化LOF模型邻域点数目(K)得到最佳K值,达到最佳检测效果。其次,构建沥青路面温湿度异常值修复样本数据库,分别采用CART、Random Forest、XGBoost、LSTM和Light GBM算法对异常值修复数据库进行预测,利用网格搜索法(GS)对上述机器学习模型进行参数优化,通过模型预测结果评价指标进行分析。实验结果表明,GS-XGBoost模型预测温湿度的相关系数R2最高,分别为0.968和0.917,平均绝对误差MAE和均方根误差RMSE也优于其它模型。最后,本文考虑到网格搜索法寻优的局限性,利用遗传算法(GA)对XGBoost模型参数进行优化,通过选择、交叉、变异确定最佳模型参数。对比发现,GA-XGBoost模相比于GS-XGBoost模型,温湿度均方根误差RMSE降低了1.16%和6.21%,速度提升了5.13和5.7倍。同时根据平稳性指标对修复前后数据进行稳定性分析,实验结果表明修复后的数据均值和中位数提高,标准差和差异系数降低,整体分布更加稳定。综上所述,本文提出的DS-LOF模型能够对时间序列进行异常值辨识,检测精度较高,可以应用到一维沥青路面温湿度异常数据检测中;同时,本文提出的GA-XGBoost模型能够对异常数据进行预测修复,提高了沥青路面温湿度数据的稳定性,对我国路面数据信息的挖掘具有重要的参考价值。
其他文献
Ni3S2具有出色的化学稳定性和良好的电子电导率,作为钠离子电池负极显示高理论比容量;然而,其在循环过程中会面临严重的体积膨胀及材料粉化,导致其循环稳定性差。为了解决上述问题,本论文从结构设计,表面改性和形貌调控等方面对Ni3S2电极进行改进,主要研究成果如下:(1)采用化学镀方法,通过原位形成的氢气泡作为模板,控制镀液p H值和温度,获得具有不同孔结构的三维多孔镍。结果显示,化学镀液的p H=9
二次供水作为城镇供水系统的“最后一公里”,是一项重要的民生工程,是增进人民福祉的基础保障。二次供水泵房能耗在整个城市供水系统能耗中占比较大,多数泵房能耗高的问题亟待解决。为提高二次供水设备效率,充分发挥叠压供水设备节能优势,本文主要针对叠压供水设备节能分析与运行优化进行以下研究:首先,研究叠压供水设备能耗组成和各个能量传递环节中效率与调速比关系,综合分析确定设备调速比范围为75%~100%。根据各
石墨烯的成功剥离,打开了探索二维半导体材料的大门。二维半导体材料优异的物理性质、实验室上的成功制备、广泛应用在纳米电子和光电领域等方面使其成为材料研究领域的焦点。但单个的二维材料不可避免地存在一些缺陷。两种或多种二维材料通过层间范德华力垂直堆叠在一起形成的范德华异质结构的出现弥补了单个二维材料的不足并获得了愈加优异的特性。这种异质结构材料选取多样、简单;形成后具有特殊的界面态;易于调控的电子结构等
出租车凭借方便、快捷、舒适度高等优点,广受出行者的喜爱,一直是城市居民常用出行方式之一。然而,随着城市传统出租车数量的增加及网约车的出现,出租车交通事故率也逐渐上升,对交通安全提出了巨大挑战。传统交通安全分析方法原理简单易懂,但缺乏对交通系统宏观层面的把控,本质上属于“事后补救”。近年来,学者们开始引入“交通安全规划”的思想,宏观规划层面的要素被纳入研究范畴,以交通分析小区(TAZ)为基本单元,分
植被净初级生产力是生态系统碳循环的重要环节,是调节生态过程的主要因子,直接反映了植被在自然环境条件下的生产能力和陆地生态系统的质量状况,在全球气候变化和碳平衡中扮演着重要的角色。因此,研究渭河流域植被净初级生产力时空变化特征、探究其对环境因子的响应情况及未来发展趋势,具有重要的理论与现实意义。本文基于遥感影像数据、气象观测数据、数字高程模型数据和土地利用类型数据等,以Arc GIS10.2、ENV
振动搅拌作为提高混凝土搅拌质量和效率的有效方法,已经在实际工程中得到了良好应用。然而在使用中发现,由于机器实测振动强度和振动分布规律与设计结果不一致,存在着混凝土产品质量不稳定、机器运转稳定性和可靠性差等问题。不合理的激振结构与参数是造成问题的重要原因之一。因此,本课题研究对提高振动搅拌机械的技术水平,充分发挥振动搅拌对混凝土材料的改善效果,具有重要的理论和实用价值。本文采用理论分析、计算机仿真和
随着工业物联网运营环境的逐渐成熟,在家具行业中,其生产线将逐步向自动化、智能化和网联化方向发展。在生产线升级的过程中,首先要解决板材特征边识别与匹配的问题。只有正确识别板材的各个特征边之后,加工设备才能与数据库中的信息匹配,并对板材做出相应的动作,避免误加工。因此,针对上述问题,本文设计了一种基于嵌入式的板材特征边识别系统。该系统具有一定的灵活性与智能性,可在满足精度要求的情况下完成识别与匹配任务
在大数据时代背景下,如何将海量数据进行有效存储成为当下研究热点。传统的集中式存储曾短暂解决过这一问题,但其存储代价高昂且存在系统性能瓶颈,使得分布式存储系统逐渐代替其成为海量数据存储的首选方案。分布式存储系统具有成本低廉、可扩展性高的特点,目前对分布式存储系统的研究主要集中在存储节点故障时如何对其进行修复,保证分布式存储系统的可靠性。分布式存储系统中,常见的故障节点修复策略有复制策略与纠删码策略,
当下水体的面源污染已成为我国长江、黄河等重要流域污染的主要成因,其中农业生产中农药的使用是导致该现象的主要诱因之一。阿特拉津(ATZ)作为我国使用最广泛的除草剂之一,已经在水体和土壤等自然环境中被检出,其对人体有“三致”危害,且在环境中难降解、易富集,严重威胁生态系统和人体健康。因此有必要采取合理的方法解决水体中ATZ污染问题。常规的水处理技术难以将水体中的ATZ去除,高级氧化技术成为解决ATZ污
随着信息网络的搭建、全球化市场的形成,市场对产品的响应速度有了更高的要求。在企业分布式库存系统的管理中,单纯采用纵向的补货策略已不足以应对需求变化和市场不确定性。因此,同级库存点之间的横向库存调拨策略应运而生,该策略具有灵活性高、响应时间短的特点,被认为是提高分布式库存系统性能的一种有前途的策略。在对横向转运策略的主动和反应两种转运方式的对比分析后,发现主动转运策略现有研究文献少、复杂度大,且存在