论文部分内容阅读
肺结核是由结核分支杆菌引起的肺部慢性传染病,飞沫传播是主要的传播途径。现代结核病控制策略中最根本和最有效的措施是有效提高肺结核患者的发现率和治愈率。准确预测肺结核发病率,制定合理的发现率目标和高危季节,具有极为重要的现实意义。肺结核的发展趋势呈现出线性与非线性相结合的特点。考虑支持向量机回归模型(SVR)处理小样本数据的优势和差分自回归移动平均(ARIMA)拟合周期性数据的特点,本文利用ARIMA预测模型、SVR预测模型、ARIMA-SVR串联模型、ARIMA-SVR并联预测模型对全国肺结核月发病趋势进行拟合。利用2009-2018年肺结核发病数据拟合肺结核发病趋势选出最优模型,预测2019-2020年肺结核月发病人数,为全国肺结核防控工作提供参考依据和模型建议。首先,本文叙述了有关肺结核的研究背景与意义、国内外研究现状以及常见传染病预测模型的预测能力,同时详细阐述时间序列线性预测模型、支持向量机非线性预测模型的理论基础和建模步骤。然后,本文以2009-2017年全国肺结核月发病数为训练集,2018年全国肺结核月发病数为测试集建立预测模型,预测2019-2020年全国肺结核发病趋势。以ARIMA线性预测模型、SVR非线性预测模型、ARIMA-SVR串联组合模型、ARIMA-SVR并联组合模型拟合全国肺结核发病趋势,利用遗传算法(GA)和粒子群算法(PSO)进行参数调优。采用RMSE、MAE、MAPE三个综合指标描述模型综合预测精度,绝对误差AE,相对误差RE两种单一误差描述具体样本数据预测效果。结果显示ARIMA(1,1,1)(2,0,0)12模型预测综合误差指标MAE(28)4492.1 16,MAPE(28).5000%,RMSE(28)5748.5 83。SVR最优模型PSO-RBF-SVR模型预测综合误差指标MAE(28)3531.279,MAPE(28)3.82%,RMSE(28)5409.772。ARIMA-SVR并联模型预测综合误差指标MAE(28)2758.3 64,MAPE(28).310%,RMSE(28)4452.7 75。ARIMA-SVR串联模型预测综合误差指标MAE(28)4492.1 15,MAPE(28).4996%,RMSE(28)5748.3 06。综上ARIMA-SVR并联组合模型拟合精度最高。ARIMA-SVR并联组合模型有效的结合了时间序列线性预测与支持向量机非线性预测的优点,在ARIMA模型基础上提高38%的预测精度,在SVR模型基础上提高18.42%的预测精度。由此可知,预测全国肺结核月发病人数趋势时,ARIMA-SVR并联组合模型预测能力优于线性模型预测与非线性模型单独效果且PSO调参效果优于GA算法。最后,本文总结了当前肺结核流行趋势、模型预测结果与可行性,指出我国目前存肺结核发病率下降缓慢,公众肺结核知识知晓率低等问题,提出春季节加大防控力度和利用ARIMA-SVR并联模型进行中短期预测等建议,同时指明本文研究内容的不足与展望。