论文部分内容阅读
糖尿病是最常见的慢性非传染病之一。据国际糖尿病联盟(IDF)最新统计,2017年全球糖尿病患者人数为4.25亿人。我国糖尿病患者人数高达1.144亿人,居全球首位,而诊断率仅为46.4%。其中90%的糖尿病患者为2型糖尿病患者。2型糖尿病是一种终身性疾病,可引发心脏病、血管等并发症,它不仅影响了患者的生活质量,也给患者和国家带来了沉重的经济负担。因此,需要早期预测2型糖尿病,及早发现2型糖尿病的高危人群,制定出该人群的健康管理方案,最终达到控制2型糖尿病的发病率的目的。本文基于数据挖掘技术、参数优化技术、分类器评估等相关理论以及健康体检数据和2型糖尿病患者数据,构建的2型糖尿病预测模型如下:首先,利用Weka 3.6.13软件及网格搜索算法优化支持向量机(SVM)的参数,构建了SVM预测模型。为了改进SVM预测模型的结果,使用属性约简筛选出2型糖尿病的最佳预测因子、使用AdaBoost算法组合多个基分类器,在此基础上,分别构建了属性约简-SVM预测模型和属性约简-AdaBoost-SVM预测模型。比较分析模拟数据的结果表明,属性约简和AdaBoost集成算法可同时提高预测模型的性能。其次,为了能在更大范围内以更高的效率搜索SVM更精确的参数,利用Matlab R2014a软件以及粒子群优化算法(PSO)、遗传算法(GA)优化SVM的参数,在此基础上,分别构建了PSO-SVM、GA-SVM预测模型。比较分析模拟数据的结果表明,PSO-SVM模型更适合于2型糖尿病的预测。本文构建一个准确率较高、性能良好、具有临床应用价值的2型糖尿病预测模型,从而及早发现2型糖尿病的高危人群,最后为其制定相应的健康管理方案,包括饮食管理、运动管理、教育与心理管理、身体指标监测,从而完成预防2型糖尿病发生的健康管理方案,实现降低2型糖尿病的发病率的目的。