论文部分内容阅读
心血管疾病是人类死亡的首要因素,其中脑卒中和冠心病在中国分别居死因的第一和第三位。高发病率、高致残率、高死亡率是心血管疾病的主要特点,同时其高昂的治疗费用给社会和国家带来了巨大的经济负担,给家庭带来了巨大的灾难。心血管疾病的早期发现和早期干预不仅可以避免患者丧失劳动能力,同时能够减少患者后续巨额的医疗费用。因此,开展心血管疾病危险因素的研究,构建心血管疾病的预测模型,对于心血管疾病的早期干预治疗的意义无疑是巨大的。本文以南方人群作为研究对象,搜集了621例冠心病患者共621例,非冠心病患者618例,进行了基于支持向量机(Support VectorModel, SVM)预测模型的构建,主要内容包括以下方面:一、分析冠心病患者与非冠心病患者各项统计指标,并对数据进行预处理。从分析结果上看,各项生理指标除高密度脂蛋白醇(HDL-C)外,冠心病患者的平均水平都要高于正常人,这与相关报道是基本一致的;同时两者之间的生理指标存在交叉部分,因此单靠生理指标并不能将冠心病患者与非冠心病患者区分开来。二、利用SVM对冠心病患者和非冠心病患者进行分类研究,构造了支持向量机分类器。根据相关报道,冠心病患者与非冠心病患者的各危险因素并非相互独立,生理指标间存在一定的相关性,且其生理指标共有9项,属于高维数据。SVM是公认的高维、小样本情况下统计学习的典范,适合高维样本分类预测,从分类结果上看,预测效果非常好。同时,利用网格参数寻优法优化SVM模型的参数,与随机参数选择的SVM进行了比较。三、利用粒子群优化算法(PSO)优化SVM支持向量机惩罚参数C和核参数,提高SVM的分类准确率、特异性和敏感性。SVM存在参数选择和核函数选择问题,需要在解空间中寻找最优参数,从实验结果上看,径向基核函数的SVM的优化效果最好。四、比较SVM、PSO优化后的SVM与其他算法的分类预测效果。本文比较将SVM、PSO-SVM与BP神经网络、线性判别法(LDA)、Logistic回归三种常见分类算法,从实验结果上看,优化后的RBF-SVM和Polynomial-SVM分类效果是最好的。