应用数据驱动的XGBoost模型预测美国新型冠状病毒肺炎流行趋势:一项时间序列分析

来源 :中国医科大学 | 被引量 : 0次 | 上传用户:xiaoxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:2020年,新型冠状病毒肺炎疫情肆虐全球,在全世界各大洲相继暴发。病毒传播力强,波及范围广。美国作为受新型冠状病毒肺炎疫情影响最严重的国家之一,预测其新型冠状病毒肺炎的流行趋势对其相关政策和预防措施的制定具有重大意义。本研究对ARIMA(autoregressive integrated moving average)模型和XGBoost(e Xtreme Gradient Boosting)模型预测美国本土新型冠状病毒肺炎的发病趋势进行比较。方法:本研究收集2020年12月13日至2021年6月30日美国本土新型冠状病毒肺炎每日确诊病例数据和疫苗接种数据,将数据分为训练集和测试集,训练集的时间范围为2020年12月13日至2021年6月16日,测试集为2021年6月17日至2021年6月30日。用训练集中的病例数据拟合ARIMA模型,测试集测试ARIMA模型的预测效果;用训练集中的病例数据和滞后得到的病例数据,同时引入疫苗数据和星期变量数据来拟合XGBoost模型,测试集测试XGBoost模型的预测效果。选取均方根误差(RMSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)三个指标评价XGBoost和ARIMA模型的拟合和预测性能。结果:1.截止于2021年7月11日,美国本土累积报告新型冠状病毒肺炎病例33595701人次,死亡病例达598442人次;约1.58亿人接种全部两针疫苗,约1.83亿人至少接种了一针疫苗。总体上美国本土新型冠状病毒肺炎发病呈波动下降趋势,但一周时间内周五、周六新病例相对高发,周一最少。2.根据修正赤池信息准则(AICc),我们获得的最优ARIMA模型为ARIMA(0,1,1)(0,1,1)7。其训练集的MAE、RMSE和MAPE分别为7061.536、13517.664和7.996%;测试集的MAE、RMSE和MAPE分别为2083.571、2633.424和15.884%。3.通过不断建模和调整参数范围,我们获得最佳的XGBoost模型。最优模型得到了16组特征变量,其重要性大小排序如下:时间趋势、完全接种疫苗人数、滞后6天的病例数、滞后7天的病例数、至少接种一针疫苗人数、滞后3天的病例数、滞后1天的病例数、滞后2天的病例数、滞后4天的病例数、滞后5天的病例数、星期天、星期一、星期四、星期三、星期五和星期六。训练集的MAE、RMSE和MAPE分别为2331.134、3500.331和4.046%;测试集的MAE、RMSE和MAPE分别为962.357、1209.984和7.892%。结论:1.研究发现,2020年12月13日至2021年6月30日美国本土新型冠状病毒肺炎每日发病人数总体呈下降趋势,同时其发病存在显著以周为单位的周期性,具体表现为一周之内周五、周六发病多,其他时间相对较少。2.对比ARIMA模型和XGBoost模型,无论是训练集还是测试集,XGBoost模型的MAE、RMSE和MAPE的值均小于ARIMA模型。因此,XGBoost模型的表现优于ARIMA,其对于美国新型冠状病毒肺炎的流行趋势的拟合和预测效果更好。
其他文献
<正>甲型H1N1流感(以下简称甲流)是继SARS后的一种急性呼吸道传染病。SARS的来袭让世界知道了中医药治疗急性传染性疾病的疗效。此次流感的到来,中医界纷纷请战,本院在李学麟教授的带领下,成立甲流病区,成为省内乃至全国为数不多的运用纯中药治疗甲流的范例。入院患者中确诊肺炎并甲型H1N1流感者有3例,余未行甲流病毒检测的流感轻
在不同时代,艺术都与当时社会有着不同的联系。艺术的介入现象背后探讨的是艺术与快速发展的当代社会的关系。笔者认为,艺术介入当代社会的形态是“社会雕塑”的延伸。本论文将两者放在同一语境进行探讨,透过“社会雕塑”的视角分析艺术介入的新形态,探究艺术与社会的未来发展趋势。本研究剖析了当代艺术介入的形态及特性,通过当代艺术的社会属性去分析其背后发生原理,明确了当代艺术的介入的中群众的参与是触发集体反思的社会
煤炭需求量提高,以及可开采煤矿储量的增加,推动着我国煤矿企业的发展,及煤矿开采技术的不断更新。现行的很多新技术是在以往的开采技术上进行了一些调整,使其能够应用于更多的矿井,并且提高了安全性与作业质量、效率。围绕现阶段煤矿工程中的采煤工艺与技术质量展开分析,提出了多种采煤工艺与技术,展开详细探讨。
基于项目式学习模式,以《义务教育生物学课程标准(2022年版)》设置的发酵食品制作类跨学科实践活动—“制作泡菜,探究影响泡菜亚硝酸盐浓度的因素”为例,设计四个子项目。从项目目标的制定、活动的设计开展到项目评价的设计,从课内到课外,从定性到定量,引领学生在完成项目的过程中提升学科核心素养。
经济的飞速发展促使建筑的功能呈现多元化的趋势,正确评价建筑的质量需要重点关注建筑的供配电系统,尤其是针对建筑内消防供配电系统的设计,一旦所设计消防供配电系统不够科学,很容易给建筑住户的财物和人身安全造成严重的损失。为了有效提高建筑的抗灾性,文章将针对建筑电气消防供配电系统的设计进行详细分析。以此提升我国建筑的安全性和使用功能。
江苏是我国水稻主产省之一,水稻常年种植面积220万hm~2左右,总产1 950万t左右,单产近9.0 t/hm~2,在保障江苏乃至全国粮食安全中的地位举足轻重。长期以来,江苏省的水稻育种一直以高产为主要目标,进入21世纪以后,优质成为江苏水稻育种的首要目标。本文综述了江苏省水稻优质育种的背景、食味品质改良的途径和优良食味粳稻品种培育的进展,剖析了江苏省优良食味粳稻育种的启示及今后江苏省水稻食味品质
<正>2022年4月,教育部发布《义务教育数学课程标准(2022年版)》(以下简称“新课标”),与时俱进地将课程内容与育人目标有机结合,突出学习和教学活动的实践导向。新课标将数学课程划分为四个领域,在其中的“综合与实践”领域指出,使用主题活动或项目学习方式,以跨学科主题学习为主体开展教育教学活动,逐步培养学生的数学核心素养。新课标也指出,跨学科学习在当前教育研究与教学改革中仍是一个新的课题。当前,
期刊
煤炭作为不可再生能源,在进行开采与利用时需要注意选择合适的采煤工艺,提升煤矿开采效率,同时贯彻落实绿色发展的理念,平衡煤矿开采与生态环境保护之间的关系。将综合机械应用于煤矿开采,可以减少对资源的浪费,也让煤矿创造出更多的价值。针对综合机械化采煤工艺进行分析,尝试提升煤矿开采的质量与效率。
<正>2022年12月,由贵州省畜牧兽医研究所牵头完成的《贵州喀斯特地区牛羊生产提质增效技术集成推广》成果荣获2019—2021年度“全国农牧渔业丰收奖”一等奖。这是该所继2016年《石漠化治理与草畜配套技术推广》成果获此奖项后,再次获奖。该成果针对喀斯特生态环境下的牛羊养殖提质增效技术持续攻关,集成“牛羊多元化经济杂交、牛羊制度化防疫、饲草高效利用及牛羊科学饲养”等提质增效技术,
期刊
双三相永磁同步发电机(DTP-PMSG)具有容错率高、低压大功率等特点,适用于受输出电压、空间体积限制的高端装备领域。常规的母线电压控制方法在负载快速变化时,存在电压恢复时间长、电压波动大的缺点。该文提出基于交轴电流计算与电容储能反馈相结合的稳压控制策略。建立脉冲宽度调制(PWM)整流器能量和功率交换数学模型,推导交轴电流内环给定的计算表达式,设计电压外环并分析物理意义。该方法既能缩短电压恢复时间