论文部分内容阅读
研究目的分析2010-2016年柳州市手足口病月发病率的时间分布规律,探讨季节性ARIMA模型、ARIMA-GRNN组合模型及XGBoost机器学习模型在手足口病发病率短期预测方面的应用。通过MAE、RMSE和MAPE等指标评估模型的优劣,从中选择出最适合柳州市手足口病月发病率预测的模型。探索性地将XGBoost机器学习方法应用于手足口病的短期预测,为传染病发病率的精准预测提供新的思路,为制定柳州市手足口病预防预警策略提供科学依据。研究方法使用Excel整理2010-2016年柳州市手足口病数据,用流行病学的方法描述其时间分布特征。将2010-2015年手足口病的月发病率数据作为训练样本,将2016年手足口病的月发病率数据作为预测样本,建立季节性ARIMA模型、ARIMA-GRNN组合模型和XGBoost机器学习预测模型。同时评估模型的优劣,评价指标为MAE、RMSE和MAPE,其值越小说明模型预测效果越好。使用IBM SPSS Statistics 16.0建立季节性ARIMA时间序列模型;使用Matlab R2014a软件在ARIMA模型的基础上建立ARIMA-GRNN组合预测模型;使用R version 3.3.3软件建立XGBoost机器学习模型。研究结果(1)2010-2016年柳州市各年手足口病累积报告发病率依次为494.72/10万、475.26/10万、618.90/10万、675.41/10万、852.08/10万、780.52/10万、765.44/10万。其中,7年累积手足口病重症病例729例,死亡40例。主要发病高峰为每年4-7月份,5月份最为严重,发病次高峰为每年的9-10月份。(2)柳州市手足口病月发病率季节性ARIMA预测模型表达式为ARIMA(1,0,0)x(1,1,0)12。模型参数AR(1)和SAR(1)均有统计学意义(P<0.001),标准化BIC值为6.236,残差序列为白噪声(Q=8.359,P=0.937)。训练样本的MAE、RMSE、MAPE依次为13.581、20.407、38.322%;预测样本的MAE、RMSE、MAPE依次为11.962、9.481、32.689%。(3)柳州市手足口病月发病率ARIMA-GRNN组合预测模型的最佳光滑因子为0.030,所对应的的RMSE值为4.285。训练样本的MAE、RMSE、MAPE依次为10.393、13.443、36.160%;预测样本的MAE、RMSE、MAPE依次为9.481、11.863、30.101%。(4)柳州市手足口病月发病率XGBoost机器学习模型的最重要预测因素为lag24,其所对应的增益值、Cover值、频率值依次为0.505、0.187、0.093。训练样本的MAE、RMSE、MAPE依次为2.106、5.311、2.650%;预测样本的MAE、RMSE、MAPE依次为7.134、10.224、13.253%。研究结论(1)2010-2016年柳州市手足口病疫情较为严峻。发病情况有明显的季节性特征,呈现出一种双峰的趋势。(2)ARIMA(1,0,0)x(1,1,0)12模型、ARIMA-GRNN组合预测模型以及XGBoost机器学习模型均可用于柳州市手足口病月发病率的拟合和预测。(3)本研究建立的柳州市手足口病月发病率预测模型,ARIMA-GRNN组合预测模型的预测效果优于乘积季节性ARIMA模型,而XGBoost机器学习模型的预测效果则优于ARIMA模型和ARIMA-GRNN组合预测模型。