基于随机森林与支持向量机的心血管疾病预测研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:JSLDYY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
心血管疾病是一种多发的慢性疾病,在给患者的身体健康造成了严重的影响的同时,为社会和患者带来了沉重的医疗负担,对心血管疾病进行快速高效的预测将有助于患者及时发现疾病。由于在对患者病情进行快速分类预测的情境下,患者的不同病情信息的获取需要耗费不同的时间,因此如何根据这些具有差异的时间耗费对患者的病情信息进行阶段性划分并对病情信息进行高效的利用对于心血管疾病的分类预测具有重要的意义。目前对于心血管疾病进行预测的研究主要集中于两个方面,一个是关于心血管疾病风险评估模型的构建,但是此类研究需要大量的患者作为长期的随访对象,不适宜于进行快速高效的研究;另外一个是将心血管疾病的预测问题抽象成为机器学习中的问题,利用机器学习方法对心血管疾病进行特征选择以及预测。然而目前的研究对心血管疾病进行快速高效预测的情境未进行较多的考虑。因此本文针对心血管疾病预测研究的特点,在考虑时间耗费的前提下,利用机器学习方法构建心血管疾病的预测模型,对心血管疾病进行快速高效的预测。首先本文基于时间耗费分阶段对心血管疾病的危险因素进行组合;然后,为实现对信息的高效利用,针对心血管疾病数据中存在不相关以及冗余信息的问题,利用随机森林方法进行特征选择,识别出各阶段危险因素组合中的关键危险因素;最后,本文利用支持向量机根据识别出的各阶段的关键危险因素对患者进行心血管疾病预测,并利用遗传算法优化支持向量机的内部参数,提升预测性能,得到在具有不同时间耗费的各阶段危险因素组合下的心血管疾病的预测结果,并对预测结果进行评估,为心血管疾病的快速分类预测提供借鉴和建议。本文利用提出的心血管疾病预测模型对冠心病的发生进行了预测,并将本文所提出的模型的预测结果与K近邻算法、Logistic回归、BP神经网络的预测结果进行了比较,比较结果显示本文所提出的模型具有更优的性能,验证了模型的有效性。
其他文献
中国在改革与发展过程中面临的诸多重大问题,如农民增收困难、城乡差距日趋扩大等问题,从其成因或者解决这些问题的出路来看,都与人力资本严重短缺有密切关系。农民收入增长
本文从内控制度在邮储资金管理中的重要作用入手,详细分析了储汇专业对操作层、监控层、决策层内控制度检查的内容,并列举了储汇专业内控制度检查的常规方法,如:现场突击检查方法
多倍化是驱动植物进化的主要力量,自然界中约30%-70%的开花植物经历过一次或多次多倍化过程,研究表明由于基因的加倍,植物表现出与其亲本形态以及生理特征方面的差异,另外多
改革开放20余年来,中国的面貌发生了翻天覆地的变化。中国共产党以其马克思主义政党的先进性不断发展马克思列宁主义的理论,开创党的建设新的伟大工程。党的先进性是由党的理
作者以合山电厂2×300MW级机组改扩建工程的施工监理为例,介绍了在火电厂施工质量控制中,监理工程师透过施工中存在一些质量通病的现象,抓住其产生的本质,采取一系列有力
一袭昆曲,一幅水墨姑苏,6月5日,丁酉芒种,北京恭王府拉开了“锦绣中华——2017中国非物质文化遗产服饰秀”系列活动的大幕。为迎接6月10日我国首个“文化和自然遗产日”,为深
进度控制是工程建设监理的三大目标之一,也是建设监理控制的难点。本文根据工程项目建设的阶段,分别论述了应采取的进度控制措施及在进度方面一些问题的对策。
随着《见字如面》《朗读者》《信中国》等以经典文学、书信作品为主要内容,以朗读为主要形式的电视节目的热播,电视朗读节目几乎成为了一种新的节目类型。传播是人类共享意义的仪式行为。在传统的舞台朗读中,表演者通过朗读与倾听者共享朗读作品的意义,为群体注入勇气资源,实现情感共鸣和社会认同。可以说,朗读本身就是一种仪式行为。电视朗读节目通过视听手段再现了传统的朗读仪式,并利用电视媒介的传播特性进行了新的仪式化
进入2008年,中国经济面临着流动性过剩、通货膨胀压力以及自然灾害带来的重重挑战,因此奥运之后中国经济将走向何方,会否衰退成为众人关注的焦点。在17日举行的2008奥运经济(北京
9.1.Diabetes mellitus930638 A study on insulin receptor of liver plasmamembranes from streptozotocin-induced diabeticrats.QIN Guangca,et al.Dept Endocrinol,1st