论文部分内容阅读
心血管疾病是当前危害人类健康最常见的疾病,且死亡人数呈逐年上升趋势。气象因素及大气污染物是心血管疾病发生、发展的重要影响因素之一,充分认识心血管疾病的危害,进一步研究心血管疾病的发病诱因,有助于降低心血管疾病死亡人数。预报模型的建立着眼于气象因素、大气污染物对疾病死亡的整体影响。但由于影响心血管疾病死亡人数的因素较多,且各因素之间具有非线性耦合关系,传统的预报模型存在预测准确率不高、有效性不强等局限性。针对这些问题,本论文以深圳市2013年1月1日—12月31日之间的空气质量和心血管疾病死亡人数为研究对象。使用BP神经网络和GM(1,1)模型,建立心血管疾病死亡人数的预测模型,并对模型进行优化,以此提高模型的预测精确度。论文的主要工作如下:(1)选择合适的指标体系。选取平均温度、平均湿度、气压、风速共4项气象因素,以及SO2、NO2、PM10、PM2.5、CO、O3共6项大气污染指标,总计10个变量构建指标体系,作为此次预测模型的输入变量。(2)数据进行预处理。对原始数据进行筛选,共365条有效数据。考虑到影响因素之间存在着相关性和数量级的差异,对数据进行相关性分析和归一化处理,以消除数据之间因差异过大而造成的映射失真。(3)建立基于BP神经网络的心血管疾病死亡人数预测模型。根据参与建模的输入和输出变量确定合理的网络结构,并在MATLAB下编写预测程序,对心血管疾病死亡人数进行预测。通过平均绝对百分误差、可接受度、预测准确率来评价预测模型。(4)建立基于GM(1,1)的心血管疾病死亡人数预测模型。考虑到心血管疾病死亡人数随时间变化的特性,以心血管疾病死亡人数的历史数据作为研究对象,采用滑动时间窗方法建立基于GM(1,1)的动态心血管疾病死亡人数预测模型。(5)建立组合优化预测模型。首先通过主成分分析(PCA)减少输入变量的维数以此来降低训练过程的复杂度,建立PCA-BP神经网络组合优化模型。其次,将BP神经网络和灰色模型进行组合,构建组合灰色神经网络模型,来克服两种单一模型的缺点,提高模型的预测性能。最后,将PCA-BP神经网络、串联型灰色神经网络和并联型灰色神经网络模型与单一的BP神经网络和GM(1,1)模型的预测结果进行对比分析。结果表明,BP神经网络预测心血管疾病死亡人数有一定的现实意义。在充分考虑历史数据的情况下,GM(1,1)模型的平均绝对百分误差为19.39%。在对原始变量进行PCA分析后建立的BP神经网络预测模型,准确率比单一BP神经网络模型提高了7.57%。在基于串联型灰色神经网络和并联型灰色神经网络的心血管疾病死亡人数预测模型中,平均绝对百分误差分别降为18.41%和14.98%,准确率分别为82.30%和87.59%,相较于单一的BP神经网络和GM(1,1)模型均有提高,且并联型灰色神经网络模型是本次仿真实验所用到的模型中预测精度最高的。本文的研究工作不仅有助于通过预报使患者提前规避致病的环境因素,而且为后续的其他疾病预报也提供了技术指导。