论文部分内容阅读
【摘 要】针对边坡监测数据的不确定性,提出了一种基于残差优化的时间序列模型(ARIMA)和BP神经网络结合的预测方法。以柳州至南宁第 K1291+900~K1292+300 段高边坡监测数据为例,通过与单一模型BP神经网络、ARIMA模型和未进行残差优化的ARIMA-BPNN组合模型作对比分析。结果表明该模型能较好的拟合高边坡监测数据的变化趋势,为高边坡的预测提供了一种新的研究方法。
【关键词】高边坡;组合模型;预测;残差优化
引言
目前,越来越多的高速公路穿过山川和丘陵地带,不可避免的需要对道路进行深挖,这就形成了高边坡[1]。由于受到降雨、风化、地下水等自然现象的影响[2],原本稳定的高边坡很容易发生泥石流、坍塌等现象,为了避免类似事故的发生,除了要建立完善的监测系统外,对高边坡的预测分析也同样重要。常用的预测模型如:小波分析、灰色模型、时间序列模型、神经网络等[3]。每种模型都存在各自的优势和缺陷,单一的预测模型已经不能满足现如今的精度要求[4],如何组合各预测模型,利用其优势,尽可能的提高预测精度,是目前研究的重点方向。
1 变形监测数据的预处理
边坡变形监测数据的预处理分为2个步骤:
(1)异常数据的预处理[5]:设某一监测站的位移时序为 ( ),对 作一阶差分得 ,差分序列 的均值为 ,标准差为 ,即当 大于3时,则认为是奇异点,取相邻两点 与 的均值代替 点。
(2)由于高边坡监测数据(x水平位移,y沉降位移)在一天内的数值变化不大,故将监测数据按天进行平滑,采集频率为1h一次,即每24个点取一次平均。
2 预测模型
2.1 ARIMA模型
MSE反映觀测值与预测值之间的离散程度;MRE为相对误差的平均值;MAE反映观测值与预测值误差的大小;R为相关系数,当R的值离1越近,表示观测值与预测值关联度越高,相应的MSE、MRE、MAE越小。
3 实例分析
由于样本容量数据较多,且在一天内监测到的水平位移与沉降位移的数据变化不大,故选取BD1、BD5监测点在2019年5月1日~2019年8月31日各天的累积水平位移平均值,共计123组数据作为研究对象,以ARIMA模型的预测值与真实值的残差序列第1~41组、42~82组、83~123组数据与真实值序列第1~41组、42~82组数据作为BP神经网络的输入层,输入层包括5个神经元,隐含层个数为10,以真实值数据第83~123组数据作为输出层。为了验证模型的拟合程度,以后14天的真实数据作为预测对比。其中累积水平位移为 (x为水平位移,y为沉降位移)。2019年5月1日~2019年8月31日监测点BD01、BD05的累积水平位移平均值原始序列如图3.1所示:
分别对监测点BD01、BD05的监测值建立ARIMA模型,AIC、BIC取值如图3.2所示。
由图3.2可知当p、q都为1时,监测点BD01、BD05的AIC、BIC分别取得最小值,监测点BD01的AIC、BIC取值分别为-1.5828与-1.5599,监测点BD05的AIC、BIC取值分别为-1.4665与-1.4437,一阶差分后,两监测点的差分序列都均匀分布于零刻度上下两侧。通过实验最终确定两监测点模型都为ARIMA(1,1,1)。
3.1 预测结果分析
监测点BD01、BD05的预测模型:ARIMA模型、BP神经网络、不进行残差优化的ARIMA-BPNN模型、残差优化的ARIMA-BPNN模型的预测结果如图3.3、3.4所示。
从图3.3可以看出ARIMA预测模型的整体趋势和真实值的趋势基本一致,反映在图像上可以看出ARIMA模型预测结果具有一定的滞后性,相当于把真实值向右平移1个单位,故而误差较大,平均残差为0.2893,BP神经网络预测值在前几天的波动性较大,后面几天过于平稳,与真实值趋势相比“下降的过慢”,所以拟合精度也不是很好,通过计算得出平均残差为0.2637,相比于单一模型,未经过残差优化的ARIMA-BPNN组合模型的拟合精度要更好,与真实值的趋势相比,前1~4天,该组合模型整体趋势具有一定的滞后性,从第6天起,拟合效果较好,平均残差为0.2371,本文提出的残差优化ARIMA-BPNN模型拟合精度最高,与未经过残差优化的ARIMA-BPNN组合模型相比,残差优化的ARIMA-BPNN组合模型在短期内反应更加灵敏,预测效果更好,虽然在最后一个点与真实值的趋势不同,但其残差较小,不影响整体拟合性能,通过计算得出该模型的平均残差为0.1914,平均残差最小。由图3.2可以看出本文提出的残差优化ARIMA-BPNN组合模型拟合精度远高于其他3种模型,整体趋势和真实值极为接近,平均残差更是达到了0.1077,进一步验证了该组合模型的可行性。
表1为监测点BD01、BD05各模型的预测结果精度对比,监测点BD01的结果显示,本文提出的模型(残差优化的ARIMA-BPNN模型)预测精度最高,MAE、MSE、R、MRE分别为0.1914、0.0502、0.8737、1.51%,同不进行残差优化的ARIMA-BPNN模型相比,MAE、MSE、MRE分别下降了19.3%、49.4%、20.1%,相关系数R增加了23.6%,和单一模型BP神经网络相比,MAE、MSE、MRE分别下降了27.4%、52.7%、25.6%,相关系数R增加了30.6%,和单一模型ARIMA模型相比,MAE、MSE、MRE分别下降了33.8%、63.5%、33.5%,相关系数R增加了34.2%,本文提出的模型在监测点BD05同样适用,各项评定指标显示,残差优化的ARIMA-BPNN模型拟合程度最好,与其他模型相比,精度提高的程度同监测点BD01类似,本文不再赘述。总的来说,将残差优化的ARIMA-BPNN模型应用在高边坡监测中能获得较高的外推预测性能和内在拟合精度,对于具有非线性特征的单一高边坡监测能进行合理的仿真模拟、预测和控制。 4 结束语
通过对柳南高速公路第K1291+900~K1292+300段的研究,笔者得出了以下结论。
(1)实际的高边坡监测数据中,即包括线性部分,也含有非线性部分,从真实值与模型拟合值的趋势图和残差结果来看,组合模型对高边坡的预测精度要高于单一模型。
(2)针对高边坡观测数据非线性复杂系统的预测,笔者提出了残差优化的ARIMA-BPNN组合模型,通过对比分析,该模型在对高边坡监测数据的预测具有较强的适应性和预测能力,为研究边坡监测数据的变化趋势提供了一种行之有效的方法。
参考文献:
[1]杨威.郴宁高速公路万华岩边坡监测与稳定性评价方法研究[D].长沙:中南大学,2013.
[2]徐颖.强降雨作用下类土质滑坡演化过程及破坏机理研究[D].武汉:中国地质大学,2014.
[3]容静,文鸿雁,周吕.一种改进灰色预测模型在变形监测中的应用[J].测绘科学,2017,42(03):35-39.
[4]徐冠奇,陈峰.汽车出厂物流需求预测模型及智能在线调度问题研究[J].工业工程与管理,2017,22(03):41-48.
[5]黎峻宇,刘立龙,蔡成辉,等.数据预处理对基于径向基函数网络高程转换的影响[J].桂林理工大学学报,2015,35(01):103-106.
[6]张鹏.改进的ARIMA-GM-SVR组合预测模型及应用[J].统计与决策,2019,(13):82-84.
[7]刘立龙,陈军,黄良柯,等.基于小波-ARIMA电离层短期总电子含量预报[J].桂林理工大学学报,2016,36(02):294-299.
[8]李辉东,关德新,袁凤辉,等.BP人工神经网络模拟杨树林冠蒸腾[J].生态学报,2015,25(12):4137-4145.
[9]姚和友,张庭芳,黄菊花,等.改进的动量项BP神经网络电池SOC估算[J].电池,2019,49(04):308-311.
[10]赵伊婷.基于时间序列的商店商品连续时期的销量预测及分析[J].科技经济导刊,2018,26(33):203-205.
[11]楊慧荣,张玉虎,崔恒建,等.ARIMA和ANN模型的干旱预测适用性研究[J].干旱区地理,2018,41(05):945-953.
[12]容静.基于ARIMA与IGWO-SVM优化模型的高铁沉降变形预测研究与应用[D].桂林:桂林理工大学,2018.
【关键词】高边坡;组合模型;预测;残差优化
引言
目前,越来越多的高速公路穿过山川和丘陵地带,不可避免的需要对道路进行深挖,这就形成了高边坡[1]。由于受到降雨、风化、地下水等自然现象的影响[2],原本稳定的高边坡很容易发生泥石流、坍塌等现象,为了避免类似事故的发生,除了要建立完善的监测系统外,对高边坡的预测分析也同样重要。常用的预测模型如:小波分析、灰色模型、时间序列模型、神经网络等[3]。每种模型都存在各自的优势和缺陷,单一的预测模型已经不能满足现如今的精度要求[4],如何组合各预测模型,利用其优势,尽可能的提高预测精度,是目前研究的重点方向。
1 变形监测数据的预处理
边坡变形监测数据的预处理分为2个步骤:
(1)异常数据的预处理[5]:设某一监测站的位移时序为 ( ),对 作一阶差分得 ,差分序列 的均值为 ,标准差为 ,即当 大于3时,则认为是奇异点,取相邻两点 与 的均值代替 点。
(2)由于高边坡监测数据(x水平位移,y沉降位移)在一天内的数值变化不大,故将监测数据按天进行平滑,采集频率为1h一次,即每24个点取一次平均。
2 预测模型
2.1 ARIMA模型
MSE反映觀测值与预测值之间的离散程度;MRE为相对误差的平均值;MAE反映观测值与预测值误差的大小;R为相关系数,当R的值离1越近,表示观测值与预测值关联度越高,相应的MSE、MRE、MAE越小。
3 实例分析
由于样本容量数据较多,且在一天内监测到的水平位移与沉降位移的数据变化不大,故选取BD1、BD5监测点在2019年5月1日~2019年8月31日各天的累积水平位移平均值,共计123组数据作为研究对象,以ARIMA模型的预测值与真实值的残差序列第1~41组、42~82组、83~123组数据与真实值序列第1~41组、42~82组数据作为BP神经网络的输入层,输入层包括5个神经元,隐含层个数为10,以真实值数据第83~123组数据作为输出层。为了验证模型的拟合程度,以后14天的真实数据作为预测对比。其中累积水平位移为 (x为水平位移,y为沉降位移)。2019年5月1日~2019年8月31日监测点BD01、BD05的累积水平位移平均值原始序列如图3.1所示:
分别对监测点BD01、BD05的监测值建立ARIMA模型,AIC、BIC取值如图3.2所示。
由图3.2可知当p、q都为1时,监测点BD01、BD05的AIC、BIC分别取得最小值,监测点BD01的AIC、BIC取值分别为-1.5828与-1.5599,监测点BD05的AIC、BIC取值分别为-1.4665与-1.4437,一阶差分后,两监测点的差分序列都均匀分布于零刻度上下两侧。通过实验最终确定两监测点模型都为ARIMA(1,1,1)。
3.1 预测结果分析
监测点BD01、BD05的预测模型:ARIMA模型、BP神经网络、不进行残差优化的ARIMA-BPNN模型、残差优化的ARIMA-BPNN模型的预测结果如图3.3、3.4所示。
从图3.3可以看出ARIMA预测模型的整体趋势和真实值的趋势基本一致,反映在图像上可以看出ARIMA模型预测结果具有一定的滞后性,相当于把真实值向右平移1个单位,故而误差较大,平均残差为0.2893,BP神经网络预测值在前几天的波动性较大,后面几天过于平稳,与真实值趋势相比“下降的过慢”,所以拟合精度也不是很好,通过计算得出平均残差为0.2637,相比于单一模型,未经过残差优化的ARIMA-BPNN组合模型的拟合精度要更好,与真实值的趋势相比,前1~4天,该组合模型整体趋势具有一定的滞后性,从第6天起,拟合效果较好,平均残差为0.2371,本文提出的残差优化ARIMA-BPNN模型拟合精度最高,与未经过残差优化的ARIMA-BPNN组合模型相比,残差优化的ARIMA-BPNN组合模型在短期内反应更加灵敏,预测效果更好,虽然在最后一个点与真实值的趋势不同,但其残差较小,不影响整体拟合性能,通过计算得出该模型的平均残差为0.1914,平均残差最小。由图3.2可以看出本文提出的残差优化ARIMA-BPNN组合模型拟合精度远高于其他3种模型,整体趋势和真实值极为接近,平均残差更是达到了0.1077,进一步验证了该组合模型的可行性。
表1为监测点BD01、BD05各模型的预测结果精度对比,监测点BD01的结果显示,本文提出的模型(残差优化的ARIMA-BPNN模型)预测精度最高,MAE、MSE、R、MRE分别为0.1914、0.0502、0.8737、1.51%,同不进行残差优化的ARIMA-BPNN模型相比,MAE、MSE、MRE分别下降了19.3%、49.4%、20.1%,相关系数R增加了23.6%,和单一模型BP神经网络相比,MAE、MSE、MRE分别下降了27.4%、52.7%、25.6%,相关系数R增加了30.6%,和单一模型ARIMA模型相比,MAE、MSE、MRE分别下降了33.8%、63.5%、33.5%,相关系数R增加了34.2%,本文提出的模型在监测点BD05同样适用,各项评定指标显示,残差优化的ARIMA-BPNN模型拟合程度最好,与其他模型相比,精度提高的程度同监测点BD01类似,本文不再赘述。总的来说,将残差优化的ARIMA-BPNN模型应用在高边坡监测中能获得较高的外推预测性能和内在拟合精度,对于具有非线性特征的单一高边坡监测能进行合理的仿真模拟、预测和控制。 4 结束语
通过对柳南高速公路第K1291+900~K1292+300段的研究,笔者得出了以下结论。
(1)实际的高边坡监测数据中,即包括线性部分,也含有非线性部分,从真实值与模型拟合值的趋势图和残差结果来看,组合模型对高边坡的预测精度要高于单一模型。
(2)针对高边坡观测数据非线性复杂系统的预测,笔者提出了残差优化的ARIMA-BPNN组合模型,通过对比分析,该模型在对高边坡监测数据的预测具有较强的适应性和预测能力,为研究边坡监测数据的变化趋势提供了一种行之有效的方法。
参考文献:
[1]杨威.郴宁高速公路万华岩边坡监测与稳定性评价方法研究[D].长沙:中南大学,2013.
[2]徐颖.强降雨作用下类土质滑坡演化过程及破坏机理研究[D].武汉:中国地质大学,2014.
[3]容静,文鸿雁,周吕.一种改进灰色预测模型在变形监测中的应用[J].测绘科学,2017,42(03):35-39.
[4]徐冠奇,陈峰.汽车出厂物流需求预测模型及智能在线调度问题研究[J].工业工程与管理,2017,22(03):41-48.
[5]黎峻宇,刘立龙,蔡成辉,等.数据预处理对基于径向基函数网络高程转换的影响[J].桂林理工大学学报,2015,35(01):103-106.
[6]张鹏.改进的ARIMA-GM-SVR组合预测模型及应用[J].统计与决策,2019,(13):82-84.
[7]刘立龙,陈军,黄良柯,等.基于小波-ARIMA电离层短期总电子含量预报[J].桂林理工大学学报,2016,36(02):294-299.
[8]李辉东,关德新,袁凤辉,等.BP人工神经网络模拟杨树林冠蒸腾[J].生态学报,2015,25(12):4137-4145.
[9]姚和友,张庭芳,黄菊花,等.改进的动量项BP神经网络电池SOC估算[J].电池,2019,49(04):308-311.
[10]赵伊婷.基于时间序列的商店商品连续时期的销量预测及分析[J].科技经济导刊,2018,26(33):203-205.
[11]楊慧荣,张玉虎,崔恒建,等.ARIMA和ANN模型的干旱预测适用性研究[J].干旱区地理,2018,41(05):945-953.
[12]容静.基于ARIMA与IGWO-SVM优化模型的高铁沉降变形预测研究与应用[D].桂林:桂林理工大学,2018.