基于随机森林的心脏病预测平台的设计与实现

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:liangxiaolong43
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网医疗时代的到来,增加了大数据的积累,而大数据的发展又促进了医疗的进步,如何将大数据与移动互联网医疗相结合是未来智能医疗领域发展的重中之重。本文将数据挖掘与移动医疗APP相结合,设计并实现了基于随机森林的心脏病预测平台,该平台围绕随机森林算法改进、平台架构设计与实现以及平台性能评估展开,主要工作和研究内容如下:(1)针对随机森林算法数据不平衡、个体分类器单一、大规模数据扩展性差等缺点,提出了三点改进方案——1、利用Bootstrap对数据集进行多层次抽取确保数据的平衡;2、采用聚类思想对个体分类器进行聚类分簇,从每个簇中选出一个代表性分类器组成多样性森林;3、借助Hadoop的分布式计算能力实现随机森林的并行化构建。依据提出的方案设计了 BDRF(Balanced And Diversity Random Forest)算法。(2)对平台进行需求分析,并给出具体设计方案。APP展示平台完成与业务功能对应的原型界面设计;后台服务器主要完成SSH(Spring+ SpringMVC +Hibernate)框架逻辑设计、数据库方案设计以及心脏病预测模型中HDFS与MySQL数据整合设计。其中后台逻辑设计采用MVC模式,降低层与层之间的耦合,便于平台业务功能的扩展;HDFS与MySQL通过sqoop(SQL-to-Hadoop)进行数据互导,数据统一存入MySQL,方便数据的查询和管理工作。(3)实现平台各个业务模块,对其实现效果进行展示,并依据UCI(University of California Irvine)心脏病数据集分别对决策树算法、随机森林算法和BDRF算法进行建模分析,验证本文心脏病预测平台的有效性和性能的提升。
其他文献
人类社会不断发展,河道文化越来越作为一种服务于人的文化,传播于设计领域,作为近些年被重新发现并创新利用的文化范畴,在实践应用中已创作出不少成功的作品,诸如:上海后滩世
采用人PBMC为实验体系,用本中心建立的生物素链霉亲和素免疫细胞化学法CD2+ 细胞增长试验对IL2 和IFNγ等9 种免疫调节药物进行活性鉴定,并用流式细胞仪加以验证。结果
1.无论对于屠宰厂、批发商或超市零售处,将来都可以供应利用快尔卫<sup>TM</sup>(Cryovac<sup>?</sup>)产品来提供更长保鲜期的冷藏肉品给内销或出口市场。2.相比于超市,由于所
近年来,速溶红茶因其时尚、便捷的特点,越来越受消费者的青睐。但传统速溶红茶多是以成品或半成品红茶为原料,再经提取、浓缩等过程加工成速溶红茶,具有生产成本高、周期长等
分析城区经济的范畴及城区经济在国民经济中的地位,探讨城区经济发展战略的选择及实现城区经济发展战略目标的途径.
19世纪著名的俄国历史学家、语言学家阿·阿·沙赫马托夫 (А .А .Шахматов)指出 :“斯拉夫民族生存之首要的、根本的问题是发源地问题”。① 一百多年后的今天 ,这
现代市场经济的主体不仅限于企业法人,商自然人、消费者也发挥着越来越重要的作用。面临商业风险的商自然人、负债消费的消费者过度负债问题已经凸显,无力偿债风险日益增大。
为避免长江水利委员会信息化建设过程中出现低水平重复建设、共享不足和开发利用效率低等问题,必须进行顶层设计。通过分析云构架、大数据、虚拟计算、虚拟存储、信息交换总
分析了城区经济的性质以及特点,与实际结合提出了城区经济发展的具体战略选择。
本文选取我国2008-2015年沪深两市A股上市公司的相关数据,分析了企业社会责任与税收规避之间的关系。研究发现,企业社会责任表现与税收规避行为显著负相关,进一步研究发现,管