论文部分内容阅读
【摘 要】根据该地消防出警数据,建立相关数学模型确定了该消防队每年2月、5月、8月、11月中第一天的三个时间段应排的值班人数、建立并验证消防救援出警次数的预测模型且对2021年各月份消防救援次数进行预测、分析了该地区2016年-2020年各类事件密度在空间上的相关性以及各类事件密度与人口密度的关系、确定了新建消防站的区域等[1]。
针对问题一,通过分析和计算得到了2月、5月、8月和11月的第一天的消防员的具体安排情况。针对问题二,将五年每月出警次数取平均值作为预测模型的标准。针对问题三,建立多项回归方程和线性回归方程,找到了拟合度大于阈值的最低项多项式。针对问题四,利用弗洛伊德算法算出各地区离各类事件密度最高处所在地区的最短距离[2],得到事件密度与位置关系的拟合方程。针对问题五,增加人口因素,采用线性回归方程来求解。针对问题六,采用弗罗伊德算法和迪杰斯特拉算法进行求解。
【关键词】多项式回归;拟合曲线函数;迪杰斯特拉算法;弗洛伊德算法
1 背景
随着我国经济的高速发展,城市空间环境复杂性急剧上升,各种事故灾害频发,安全风险不断增大,消防救援队承担的任务也呈现多样化、复杂化的趋势。因此,对于某一地区的消防救援队出警次数、值班人数以及各类消防事件发生次数的分析显得尤为重要。对于每一起出警事件,消防救援队都会对其进行详细的记录,这对消防救援队安排值班部署和警力协调具有很大的指导意义。
2 问题分析
对于问题一,定义值班人数应高于最高出警次数,再统计出5年内各2、5、8、11月第一天的三个时间段的最高出警次数,最后据此安排值班人数。不过值得注意的是,在安排值班人数时,应该考虑到此次安排应一直延续到下次重新安排值班。所以采取首先将数据进行处理,统计出5年内2-4、5-7、8-10、11-1月的0:00-8:00、8:00-16:00、16:00-24:00的最大出警次数。再根据得出的最大出警次数表进行合理的值班安排,假设有出警次数大于值班人数的情况,可将剩下的人数按照比例进行分配。
对于问题二,以月为周期,运用时间序列预测模型,用16年-19年的数据计算,再用20年1月-12月的真实数据进行验证,以回归预测均方差和回归预测平均绝对误差对预测结果进行稳定性分析,以平均绝对百分比误差进行准确性分析。最后再次使用时间序列预测模型21年各月份消防出警次数。
对于问题三,建立各类事件发生次数与月份关系的多种数学模型,以拟合度最优为评价标准,确定每类事件发生次数的最优模型,采用两种数学模型,一种是线性回归方程,另一种是多项式回归方程。对于拟合度阈值的设取,考虑到如果拟合度值阈值过大的话对于下一次数据的误差可能会很大,拟合度阈值过小则不能很好的预测下一年的数据,所以本文设置的拟合度阈值为0.5。
对于问题四,经过计算得到事件密度。然后做出事件密度空间图(空间-位置分布)即构建事件密度与位置关系的拟合方程,用到的反距离权重模型,主要用于构建与地理位置有关的函数。
对于问题五,加入人口因素,计算得到每一类事件的发生密度与不同区域人口密度的数据。利用线性回归方程求得相应的表达式。将人口密度作为横轴事件发生密度作为纵轴绘制离散图,然后利用离散图求得相应的线性回归方程。
对于问题六,消防站的建站主要考虑的因素为出警成本,在成本最低的地方建站。出警成本主要的影响因素有:消防站和灾害地的距离、各区域事件密度。
3 建模与求解
3.1 问题一
定义值班人数应高于最高出警次数,再统计出5年内各2、5、8、11月第一天的三个时间段的最高出警次数,最后据此安排值班人数。不过值得注意的是,在安排值班人数时,应该考虑到此次安排应一直延续到下次重新安排值班。所以可以采取首先将数据进行处理,统计出5年内2-4、5-7、8-10、11-1月的0:00-8:00、8:00-16:00、16:00-24:00的最大出警次数。然后充分考虑极限情况,通过对四个月份中的所统计的最大出警次数的最大值的情况安排人数为30人,通过三个时间段的比值分配,不足5人的安排五人。然后其他非极限情况下的安排人数与出警次数比保持为1,然后不足5人的安排5人。
3.2 问题二
以每月出警次数的均值做为参考,统计出2016-2019年各月分出警的次数,然后运用时间序列预测模型,把历史时刻变量所有值的平均值作为预测值,用16年-19年的相同月份的出警次数的均值作为2020年个月出警次数数据的预测,以月为周期,运用时间序列预测模型,用16年-19年的数据计算,再用20年1月-12月的真实数据进行验证,以回归预测均方差和回归预测平均绝对误差对预测结果进行稳定性分析,以平均绝对百分比误差进行准确性分析。最后再次使用时间序列预测模型21年各月份消防出警次数。
3.3 问题三
分别统计各类事件五年内平均每年在各个月发生的次数,做出7类事件月份和事件发生次数年均值的散点图。利用多项式回归模型,对各类事件进行拟合,由于并拟合相关系数(R^2)的值越大,相关性越强,但是精度越小,选择拟合相关系数(R^2)的阈值为0.5,取超过阈值的最低次数取拟合各类事件数据。
3.4 问题四
统计计算出得到事件密度。发现各类事件密度在P区域均为最高,然后通过弗洛伊德算法计算出各个区域距离P区域的最短距离,做出各类事件离P区域的距离与事件密度的散点图,利用反距离权重模型,通过曲线拟合取拟合现有数据集拟合方程为 Y=A/X^2。
3.5 问题五
加入人口因素。计算得到每一类事件的发生密度与不同区域人口密度的数据。利用线性回归方程求得相应的表达式。将人口密度为横轴事件发生密度为纵轴绘制离散图,然后利用离散图求得相应的线性回归方程。为判断线性回归方程的准确性从两个方面出发:稳定性和准确性。稳定性主要由两个因素来决定,分别是线性回归均方差和线性回归平均绝对误差。准确性的判断因素是拟合相关系数。
3.6 問题六
消防站的建站主要考虑的因素为出警成本。定义:出警成本=出警次数*出警距离。消防站应在使的出警成本最低的地方建站。首先统计出各区域平均每年出警的次数,然后利用迪杰斯特拉算法得出每个区域到已有的两个消防站最短的距离,通过枚举求出满足出警成本最小的下一个消防站为P区域。依次类推,求出消防站从2023,2026,2029年这三年分别修建的消防站区域依次为E,A和H区域。
4 总结
消防灾害和事故在不同地区随着时间变化有着一定的规律性和稳定性,同时消防排班这一类的问题通常会用到线性回归和多项式回归的方法。问题一发现消防救援任务在一年之中主要集中在上半年,并且救援任务呈现双峰式的分布情况。问题二采用了时间序列预测模型进行预测,用前四年的数据进行预测后一年情况,在利用第五年数据校核的过程中发现模型和预期的较为吻合。在问题三中拟合度阈值的选取通常集中在0.5,如果阈值过大或者过小都将造成次年的图像波动过大。找到拟合度大于阈值的最低项多项式,进而求得区域间相关性最强的事件类别。问题五主要是构建了线性回归方程发现构建的线性回归方程的相关系数达到了0.999,证明线性回归方程具有很强的相关性。问题六采用了弗洛伊德算法和迪杰斯特拉算法进行求解,通过这两个算法找到了在问题条件下最经济位置的建站。影响经济主要是两个方面:①事故在该地区的发生数量;②距离的远近,建站主要是建在距离较近和事故多发地区。
参考文献:
[1]张贻民,梁明.数学建模的几种基本预测方法的探讨[J].茂名学院学报,2006(06):39-42+45.
[2]左文泽. 基于情景分析的城市应急救援调度研究[D].哈尔滨工业大学,2019.
针对问题一,通过分析和计算得到了2月、5月、8月和11月的第一天的消防员的具体安排情况。针对问题二,将五年每月出警次数取平均值作为预测模型的标准。针对问题三,建立多项回归方程和线性回归方程,找到了拟合度大于阈值的最低项多项式。针对问题四,利用弗洛伊德算法算出各地区离各类事件密度最高处所在地区的最短距离[2],得到事件密度与位置关系的拟合方程。针对问题五,增加人口因素,采用线性回归方程来求解。针对问题六,采用弗罗伊德算法和迪杰斯特拉算法进行求解。
【关键词】多项式回归;拟合曲线函数;迪杰斯特拉算法;弗洛伊德算法
1 背景
随着我国经济的高速发展,城市空间环境复杂性急剧上升,各种事故灾害频发,安全风险不断增大,消防救援队承担的任务也呈现多样化、复杂化的趋势。因此,对于某一地区的消防救援队出警次数、值班人数以及各类消防事件发生次数的分析显得尤为重要。对于每一起出警事件,消防救援队都会对其进行详细的记录,这对消防救援队安排值班部署和警力协调具有很大的指导意义。
2 问题分析
对于问题一,定义值班人数应高于最高出警次数,再统计出5年内各2、5、8、11月第一天的三个时间段的最高出警次数,最后据此安排值班人数。不过值得注意的是,在安排值班人数时,应该考虑到此次安排应一直延续到下次重新安排值班。所以采取首先将数据进行处理,统计出5年内2-4、5-7、8-10、11-1月的0:00-8:00、8:00-16:00、16:00-24:00的最大出警次数。再根据得出的最大出警次数表进行合理的值班安排,假设有出警次数大于值班人数的情况,可将剩下的人数按照比例进行分配。
对于问题二,以月为周期,运用时间序列预测模型,用16年-19年的数据计算,再用20年1月-12月的真实数据进行验证,以回归预测均方差和回归预测平均绝对误差对预测结果进行稳定性分析,以平均绝对百分比误差进行准确性分析。最后再次使用时间序列预测模型21年各月份消防出警次数。
对于问题三,建立各类事件发生次数与月份关系的多种数学模型,以拟合度最优为评价标准,确定每类事件发生次数的最优模型,采用两种数学模型,一种是线性回归方程,另一种是多项式回归方程。对于拟合度阈值的设取,考虑到如果拟合度值阈值过大的话对于下一次数据的误差可能会很大,拟合度阈值过小则不能很好的预测下一年的数据,所以本文设置的拟合度阈值为0.5。
对于问题四,经过计算得到事件密度。然后做出事件密度空间图(空间-位置分布)即构建事件密度与位置关系的拟合方程,用到的反距离权重模型,主要用于构建与地理位置有关的函数。
对于问题五,加入人口因素,计算得到每一类事件的发生密度与不同区域人口密度的数据。利用线性回归方程求得相应的表达式。将人口密度作为横轴事件发生密度作为纵轴绘制离散图,然后利用离散图求得相应的线性回归方程。
对于问题六,消防站的建站主要考虑的因素为出警成本,在成本最低的地方建站。出警成本主要的影响因素有:消防站和灾害地的距离、各区域事件密度。
3 建模与求解
3.1 问题一
定义值班人数应高于最高出警次数,再统计出5年内各2、5、8、11月第一天的三个时间段的最高出警次数,最后据此安排值班人数。不过值得注意的是,在安排值班人数时,应该考虑到此次安排应一直延续到下次重新安排值班。所以可以采取首先将数据进行处理,统计出5年内2-4、5-7、8-10、11-1月的0:00-8:00、8:00-16:00、16:00-24:00的最大出警次数。然后充分考虑极限情况,通过对四个月份中的所统计的最大出警次数的最大值的情况安排人数为30人,通过三个时间段的比值分配,不足5人的安排五人。然后其他非极限情况下的安排人数与出警次数比保持为1,然后不足5人的安排5人。
3.2 问题二
以每月出警次数的均值做为参考,统计出2016-2019年各月分出警的次数,然后运用时间序列预测模型,把历史时刻变量所有值的平均值作为预测值,用16年-19年的相同月份的出警次数的均值作为2020年个月出警次数数据的预测,以月为周期,运用时间序列预测模型,用16年-19年的数据计算,再用20年1月-12月的真实数据进行验证,以回归预测均方差和回归预测平均绝对误差对预测结果进行稳定性分析,以平均绝对百分比误差进行准确性分析。最后再次使用时间序列预测模型21年各月份消防出警次数。
3.3 问题三
分别统计各类事件五年内平均每年在各个月发生的次数,做出7类事件月份和事件发生次数年均值的散点图。利用多项式回归模型,对各类事件进行拟合,由于并拟合相关系数(R^2)的值越大,相关性越强,但是精度越小,选择拟合相关系数(R^2)的阈值为0.5,取超过阈值的最低次数取拟合各类事件数据。
3.4 问题四
统计计算出得到事件密度。发现各类事件密度在P区域均为最高,然后通过弗洛伊德算法计算出各个区域距离P区域的最短距离,做出各类事件离P区域的距离与事件密度的散点图,利用反距离权重模型,通过曲线拟合取拟合现有数据集拟合方程为 Y=A/X^2。
3.5 问题五
加入人口因素。计算得到每一类事件的发生密度与不同区域人口密度的数据。利用线性回归方程求得相应的表达式。将人口密度为横轴事件发生密度为纵轴绘制离散图,然后利用离散图求得相应的线性回归方程。为判断线性回归方程的准确性从两个方面出发:稳定性和准确性。稳定性主要由两个因素来决定,分别是线性回归均方差和线性回归平均绝对误差。准确性的判断因素是拟合相关系数。
3.6 問题六
消防站的建站主要考虑的因素为出警成本。定义:出警成本=出警次数*出警距离。消防站应在使的出警成本最低的地方建站。首先统计出各区域平均每年出警的次数,然后利用迪杰斯特拉算法得出每个区域到已有的两个消防站最短的距离,通过枚举求出满足出警成本最小的下一个消防站为P区域。依次类推,求出消防站从2023,2026,2029年这三年分别修建的消防站区域依次为E,A和H区域。
4 总结
消防灾害和事故在不同地区随着时间变化有着一定的规律性和稳定性,同时消防排班这一类的问题通常会用到线性回归和多项式回归的方法。问题一发现消防救援任务在一年之中主要集中在上半年,并且救援任务呈现双峰式的分布情况。问题二采用了时间序列预测模型进行预测,用前四年的数据进行预测后一年情况,在利用第五年数据校核的过程中发现模型和预期的较为吻合。在问题三中拟合度阈值的选取通常集中在0.5,如果阈值过大或者过小都将造成次年的图像波动过大。找到拟合度大于阈值的最低项多项式,进而求得区域间相关性最强的事件类别。问题五主要是构建了线性回归方程发现构建的线性回归方程的相关系数达到了0.999,证明线性回归方程具有很强的相关性。问题六采用了弗洛伊德算法和迪杰斯特拉算法进行求解,通过这两个算法找到了在问题条件下最经济位置的建站。影响经济主要是两个方面:①事故在该地区的发生数量;②距离的远近,建站主要是建在距离较近和事故多发地区。
参考文献:
[1]张贻民,梁明.数学建模的几种基本预测方法的探讨[J].茂名学院学报,2006(06):39-42+45.
[2]左文泽. 基于情景分析的城市应急救援调度研究[D].哈尔滨工业大学,2019.