论文部分内容阅读
[目的]探索应用机器学习预测流感这类公共卫生风险的可行性和有效性.[方法]首先,收集2009-2016年兰州市的流感和气象数据,拆分成2009-2015年和2016年两组,分别作为训练和验证数据;然后,分别基于SARIMA、Kalman Filter和VAR建立三种机器学习预测方法,并设计两种多方法联合预测策略;最后,评估、比较上述方法(策略)的预测性能.[结果]在设定的全期、爆发期和稳定期三种场景下,SARIMA、VAR和Kalman Filter方法的预测效果分别为最佳(RMSE分别为11.68、19.23和1.60;R2分别为0.932、0.923和0.956);多方法联合策略可进一步提升三种场景下的预测效果,其中联合策略Comb 2的表现更好(RMSE分别为10.82、14.68和1.38;R2分别为0.942、0.934和0.963).[局限]相关数据限制,主要考虑了气象一类外部相关因素.[结论]应用机器学习预测流感等公共卫生风险具有可行性和有效性,且潜力巨大.但目前面临的主要困境是多源数据缺乏,需要从技术、组织和制度层面打破数据壁垒,推动数据共享与开放.