【摘 要】
:
随着社会的不断发展,心血管疾病对我们生命安全的影响越来越大。近几年,将机器学习方法和医疗领域相结合成为了一种趋势,但大多数学者更关注运用机器学习预测肿瘤、癌症等疾病,将机器学习应用于心血管疾病的研究较少。实际上,心血管疾病的死亡率高于癌症、肿瘤等疾病,将机器学习方法应用于心血管疾病的预测研究显得尤为重要。本文主要采用逻辑回归、XGBoost、Light GBM算法及三者的融合模型对心血管疾病数据进
论文部分内容阅读
随着社会的不断发展,心血管疾病对我们生命安全的影响越来越大。近几年,将机器学习方法和医疗领域相结合成为了一种趋势,但大多数学者更关注运用机器学习预测肿瘤、癌症等疾病,将机器学习应用于心血管疾病的研究较少。实际上,心血管疾病的死亡率高于癌症、肿瘤等疾病,将机器学习方法应用于心血管疾病的预测研究显得尤为重要。本文主要采用逻辑回归、XGBoost、Light GBM算法及三者的融合模型对心血管疾病数据进行建模研究。在训练分类器时采用10折交叉验证的方法对分类器进行训练,防止出现过拟合。在实证分析部分选取了Kaggle在线平台的70000条数据进行分析,选择了性别、年龄、血压、身高等11个变量作为研究指标,以保证模型的精度。分类方式为二分类,两类数据分别为“患心血管疾病”和“不患心血管疾病”,数据个数基本一致,不存在数据不平衡的问题。在对数据的描述统计的过程中发现,年龄、体重、血压、吸烟情况都是影响心血管疾病的重要因素。在调参的过程中,采用网格搜索法对参数进行调整。从分类结果来看,逻辑回归的分类准确率为72.13%,XGBoost的分类准确率为73.67%,Light GBM的分类准确率为73.72%,融合模型的分类准确率为74.98%,四种模型都能很好的对心血管疾病进行预测研究。整体来说,融合模型对心血管疾病的预测能力最好,逻辑回归在四种模型中表现最差,XGBoost和Light GBM的预测能力基本一致,但XGBoost模型要比Light GBM消耗更多的时间。总的来说,在心血管疾病的预测上,可以优先考虑融合模型和Lightg GBM模型。
其他文献
具身认知观认为一个人的身体、行为、感知和情境都参与于我们的认知过程中。根据具身认知观,人们能在语言理解过程中自动地激活感知运动系统,强调感知运动系统在语言理解中起着重要作用。具身效应是指身体或环境变量对人类认知加工的影响。以往的具身效应相关研究证明了字面语言的加工中存在具身效应,却较少关注隐喻中是否存在具身效应。此外,大多数字面语言的相关行为研究采用动作-句子一致性效应证明了动作语言理解与动作之间
吡啶结构广泛存在于天然产物、药物分子、生物活性分子、有机催化剂和配体中。用廉价易得的原料多样性地合成这些化合物具有重要的应用价值和研究意义。本论文分别以简单易得的单环1,2,3-三嗪与酮或乙腈衍生物为原料,在碱的促进下通过串联的亲核加成反应高效地构建多取代吡啶。通过改变底物类型的方法,能以正交的方式较好地在吡啶C2、C3、C5和C6位引入取代基,解决吡啶不易官能团化的难题。不但为相关药物分子及活性
过去,对于城市空间形态的建设,都是国外有好的理论和范式,我们就迁移过来,小街区也是如此。但实际上并不能完全实现。空间形态模式的形成,与其社会制度发展的阶段和社会大环境是密切相关的。它代表了一定社会制度下特定社会的人们的特定需求在物理形态上的表达,其内部必然有自发逻辑隐匿其中。单纯的移植其他国家好的模式,由于其内在构成逻辑不同,并不能解决实质性问题。在当前城市由增量扩张向存量更新的发展过程中,为了城
随着计算机技术的发展与普及,软件数量不断增多,软件的的规模和复杂度也在大幅增加,软件的开发、维护以及重用的难度也随之大大提高。程序理解是程序进行分析、抽象、推理的过程,在软件开发的各个环节发挥重要作用。通过程序理解充分挖掘出程序中的隐含特征,将代码抽象为特征向量从而应用于代码补全、代码纠错、代码克隆检测等下游任务,能够助力于软件工程、计算机教育等领域。深度学习是一种数据驱动的端到端的方法,在大规模
庄子学说在哲学史上的地位突出,影响深远。由于时代的不同,对解庄侧重点也有所不同。明代庄学著作颇丰,李贽在注解《老子》后,开始注解《庄子》,对庄子思想有了新的注解方向。李贽在解庄特点层面上有创新,不拘泥于传统的解庄方式,富有开放、自由、自我的精神。而在具体思想内容上,李贽综合佛学和道家学说的思想,在注解庄子的同时赋予了自己的独特思考。李贽在注解庄子后,其启蒙思想已经更加系统、深刻。全文共分为六部分:
支持向量机作为现今最流行的分类算法之一,已经被广泛地应用于生活中的各个领域。它不仅有着较为完善的理论背景,在数据分类时也有很好的表现。支持向量机不仅可以处理简单的线性可分的数据集,结合核函数,还可以将非线性可分的数据集映射到高维空间上,从而得到不错的分类效果。现实生活中的分类问题往往是非线性可分的,所以在应用支持向量机时,核函数的选择及其相应参数的调整变得尤为重要。考虑到高斯径向基核函数无论对于大
在经济和技术不断发展,新兴市场、技术不断涌现的社会背景下,传统大企业与具有互补性技术的新兴企业开展协同价值创造,已成为传统大企业实现转型升级,新兴企业生存发展的重要途径。然而传统大企业与新兴企业协同价值创造过程是风险与收益并存的,由于协同企业间目标协同性、企业资源禀赋等差异,造成两类企业协同价值创造的失败率居高不下。针对这一现象,本文以资源依赖理论为基础,从风险收益视角,采用博弈论、双案例对比分析
在现实世界中,我们所接触过的许多受监督的机器学习问题,都具有表格特征和实值目标。但是在其中一些问题上,比如在处理医疗保健、天气预报等任务时,预测的不确定性估计往往至关重要。概率预测(一种模型在整个结果空间上输出完整概率分布的方法)是量化那些不确定性的自然方法。梯度提升机(GBM)已经在结构化输入数据的预测任务中取得了广泛的成功,但是目前还没有一种用于对实值输出进行概率预测的简单提升解决方案。在本文
近年来随着东北经济的衰退,有关于东北的负面新闻占据了各大媒体的主要版面。各类媒体唱衰东北的同时也将东北经济的落后归根于多方面:体制僵硬,思想落后,没有规则意识,随之而来的便是各类媒体和媒介针对东北人的污名化和地域歧视。这其中体现为主流媒体先行发声,自媒体等跟进的特征。目前针对东北人的污名化愈演愈烈,在各类自媒体平台收获了不少的关注,尤其是随着短视频自媒体的出现,这种短平快的载体将东北人的形象呈现特
二次矩阵不等式(Quadratic Matrix Inequality,QMI)可用来描述控制系统的稳定性问题,但QMI约束优化问题一般是非凸的,即使QMI可行性问题一般也是NP-难的.近些年来,QMI约束优化问题的求解吸引了越来越多的关注.本文主要研究二次矩阵不等式约束的二次规划(QMI Constrained Quadratic Programming,QMICQP)问题的精确半定形式和双线性