论文部分内容阅读
患者就诊量预测是解决急诊科过度拥挤的常用方法。但大量研究缺乏应用性。医疗资源的分配与患者需求相关,因此,以患者的发病规律为基础,考虑影响患者发病和就诊的日期和环境因素,建立急诊患者就诊预测模型对于急诊患者预测和管理的衔接有实际意义。
[目的]本研究以三甲医院急诊患者就诊量为研究对象,运用XGBoost算法建立一个通过日期和环境因素分级预测急诊就诊量的预测模型,并通过SHAP解释特征变量对模型的贡献。
[方法]本研究使用2016年1月1日至2018年12月28日广州某三甲医院急诊科各分诊等级和患者总量的日访问量数据,建立并测试了三种不同的患者量预测模型。三种预测模型分别为ARIMA模型、不包含天气特征的XGBoost模型和包含天气特征的XGBoost模型。其中,XGBoost模型使用10倍交叉验证法来训练和测试预测模型,对于预测性能强的一组利用SHAP解释XGBoost模型中的特征贡献。所有模型的预测准确性均通过平均绝对百分比误差(MAPE)和平均绝对误差(MAE)来衡量。
[结果]1093天内共有333390例患者,其中一级患者1015例,二级患者14282例,三级患者177358例,四级患者140735例。ARIMA模型和包含天气因素的XGBoost模型的预测准确性优于不包含天气特征的XGBoost模型。一级患者ARIMA(1,0,1)模型、不包含天气因素和包含天气因素的XGBoost模型MAPE分别为41.096%,84.151%,61.798%;二级患者ARIMA(1,0,1)模型、不包含天气因素和包含天气因素的XGBoost模型MAPE分别为32.553%,34.208%,32.250%,三级患者ARIMA(7,0,7)模型、不包含天气因素和包含天气因素的XGBoost模型MAPE分别为11.986%,13.472%,11.300%,四级患者ARIMA(7, 0,8)模型、不包含天气因素和包含天气因素的XGBoost模型MAPE分别为15.715%,20.035%,15.001%,患者总量ARIMA(7,0,6)模型、不包含天气因素和包含天气因素的XGBoost模型MAPE分别为7.843%,8.678%,6.940%。包含天气因素XGBoost模型的SHAP图表明环境特征对于一级患者更重要,日期因素对于二级、三级和四级患者更重要。
[结论]本研究表明,首先,通过与ARIMA算法的比较,XGBoost模型具有较好的预测能力,其次,ARIMA算法对数据的稳定性要求高,XGBoost算法的泛化能力强,可实现突发事件的急诊就诊量预测,优于ARIMA算法。SHAP值的应用提高了算法可解释性。此外,急诊就诊量与日期因素和环境因素相关。急诊科在安排医疗资源和人员配备时应考虑三、四级患者人流量的周期变动,在环境较差时注意急危重症患者对急救资源的需求。
[目的]本研究以三甲医院急诊患者就诊量为研究对象,运用XGBoost算法建立一个通过日期和环境因素分级预测急诊就诊量的预测模型,并通过SHAP解释特征变量对模型的贡献。
[方法]本研究使用2016年1月1日至2018年12月28日广州某三甲医院急诊科各分诊等级和患者总量的日访问量数据,建立并测试了三种不同的患者量预测模型。三种预测模型分别为ARIMA模型、不包含天气特征的XGBoost模型和包含天气特征的XGBoost模型。其中,XGBoost模型使用10倍交叉验证法来训练和测试预测模型,对于预测性能强的一组利用SHAP解释XGBoost模型中的特征贡献。所有模型的预测准确性均通过平均绝对百分比误差(MAPE)和平均绝对误差(MAE)来衡量。
[结果]1093天内共有333390例患者,其中一级患者1015例,二级患者14282例,三级患者177358例,四级患者140735例。ARIMA模型和包含天气因素的XGBoost模型的预测准确性优于不包含天气特征的XGBoost模型。一级患者ARIMA(1,0,1)模型、不包含天气因素和包含天气因素的XGBoost模型MAPE分别为41.096%,84.151%,61.798%;二级患者ARIMA(1,0,1)模型、不包含天气因素和包含天气因素的XGBoost模型MAPE分别为32.553%,34.208%,32.250%,三级患者ARIMA(7,0,7)模型、不包含天气因素和包含天气因素的XGBoost模型MAPE分别为11.986%,13.472%,11.300%,四级患者ARIMA(7, 0,8)模型、不包含天气因素和包含天气因素的XGBoost模型MAPE分别为15.715%,20.035%,15.001%,患者总量ARIMA(7,0,6)模型、不包含天气因素和包含天气因素的XGBoost模型MAPE分别为7.843%,8.678%,6.940%。包含天气因素XGBoost模型的SHAP图表明环境特征对于一级患者更重要,日期因素对于二级、三级和四级患者更重要。
[结论]本研究表明,首先,通过与ARIMA算法的比较,XGBoost模型具有较好的预测能力,其次,ARIMA算法对数据的稳定性要求高,XGBoost算法的泛化能力强,可实现突发事件的急诊就诊量预测,优于ARIMA算法。SHAP值的应用提高了算法可解释性。此外,急诊就诊量与日期因素和环境因素相关。急诊科在安排医疗资源和人员配备时应考虑三、四级患者人流量的周期变动,在环境较差时注意急危重症患者对急救资源的需求。