论文部分内容阅读
脑卒中,具有“四高一多”等特征以及发病人群年轻化趋势,不可逆转,严重威胁着人类的生命和健康。其中,缺血性脑卒中占卒中总人数的60%-70%。因此,提前筛查缺血性脑卒中高危个体至关重要。本文基于数据挖掘分类算法及其评估等相关理论,构建缺血性脑卒中风险预测模型,筛查高危人群,并进行健康管理。首先,通过合作医院获取样本,利用相关的数据处理技术对收集的样本数据进行预处理,同时采用Logistic回归算法精简缺血性脑卒中风险预测的指标集。其次,为提升模型的可操作性与实用性,在精简的指标集上分别从简单个人水平与复杂临床水平建立不同水平的缺血性脑卒中风险预测模型,以筛查不同水平脑卒中高危人群。第三,为规避单一分类器的局限性,本文综合比较多个分类器(决策树和支持向量机)的优劣,同时运用多种模型评估方法对已构建的缺血性脑卒中风险预测模型的性能进行评价。最后,为了实现脑卒中高危人群筛查的高精度、高准确率的要求,本文采用网格搜索算法分别优化支持向量机算法与集成决策树的随机森林算法,并将优化的算法与单一算法进行对比,最终寻求建立各方面最佳的风险预测模型。同时将预测模型应用于缺血性脑卒中健康管理系统中。本文构建缺血性脑卒中风险预测模型的评估结果如下:(1)在单一分类器中,支持向量机模型各方面表现性能最佳。(2)在集成优化模型中,使用网格搜索优化的RF模型各方面性能均优于任何一种单一分类器构建的模型,同时优于构建的网格搜索优化SVM模型,成为缺血性脑卒中风险预测模型中稳定性最好,学习速度最快,分类效果最佳的模型。