基于机器学习的脑卒中风险预测模型的研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:fondfood
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脑卒中是危害人们健康的主要疾病之一,是世界上仅次于心脏病的第二大死亡原因,是我国人口的首要死亡原因。它的发病率高,很容易造成成年人残疾,严重危害人们的健康,如果不及时治疗,甚至会导致死亡。根据研究可知,对脑卒中风险进行早期预测可以帮助医生和患者及时关注疾病并尽早干预,可以有效降低脑卒中发病率和并发症的风险,因此及时诊断和干预是及其重要的。本次研究旨在构建用于预测早期脑卒中风险的机器学习模型。本次研究选用数据集是来自kaggle网站上的“healthcare-dataset-stroke-data”脑卒中预测数据集。该数据集包括5110个样本(249名脑卒中患者和4861名非脑卒中患者),可以明显发现数据集严重不平衡,本文将采用SMOTE-NC处理不平衡数据集。对于同时具有名义特征和连续特征的数据集,SMOTE-NC是唯一一种基于SMOTE来平衡数据的过采样技术。为实现对脑卒中的准确预测,结合之前研究者所使用的预测方法,本文提出了一种基于Stacking的集成学习模型作为脑卒中风险预测方法。在本次研究中,使用了逻辑回归(LR)、支持向量机(SVM)、K-最近邻(KNN)、决策树(DT)、随机森林(RF)、自适应提升分类树(Adaboost)、梯度提升树(GBDT)、极端梯度提升(XGBoost)、高斯朴素贝叶斯(Gaussian NB)、伯努利朴素贝叶斯(Bernoulli NB)这十种分类算法作为候选基分类器进行训练,并比较了它们作为脑卒中预测模型的表现。实证实验结果表明,梯度提升树(GBDT)的准确率最高,为97.02%,其次是XGBoost,为96.09%,Adaboost为95.53%。最后选用表现较好的算法作为Stacking框架的第一层基学习器,选用随机森林算法作为第二层的元学习器进行训练。对于本文提出的基于Stacking的融合模型,准确率达到97.48%,精度达到97.50%,召回率达到97.48%。与单一的模型相比,融合模型的分类性能最好,因此该融合算法可以为脑卒中的早期筛查提供参考,并有可能用于其他疾病的早期筛查。
其他文献
实施乡村振兴战略需要高度重视发展农村义务教育,乡村教师作为农村贯彻党的教育方针,落实立德树人根本任务的主体之一,在建设高质量教育体系中的作用不容忽视,提升乡村教师的整体素质势在必行。新疆作为我国西部欠发达地区,在教育资源整体落后的情况下,乡村教师队伍的总体发展面临着许多的困难,其中,乡村教师的培训问题尤为突出,主要包括:老师缺乏话语权,处于“被培训”状态;培训内容和形式单一化;培训的体制、机制不够
期刊
企业并购是市场机制作用下企业为获得其他企业控制权而进行的产权交易活动。自1993年9月证券市场完成第一次并购重组以来,我国企业并购市场发展迅速。在当前供给侧改革的背景下,传统行业谋求升级转型,资本市场与电商直播行业的合作不断增加,并购失败案例也频频发生。因此本文选取尚纬股份并购星空野望事件,对上市公司并购电商直播公司的动因、失败原因进行研究探讨。本文首先阐述文章的研究背景和意义,介绍文章的研究内容
学位
衍生品的发展原本是为了消除原生品的不确定性,从而控制风险。但随着我国利率市场化与金融市场混业经营的不断推进,商业银行的经营压力与日俱增,衍生品也不再仅仅被商业银行用于风险管理,而是成为了商业银行新的利润增长点。越来越多的银行开始在衍生品业务上开拓创新,比如推出贵金属、外汇、能源等与期货合约挂钩的产品,以满足个人投资者的需求。但银行衍生品业务的发展也伴随了新的风险管理问题。盲目地追求利润,而忽视风险
学位
学位
中国经济社会经过30多年的快速发展,取得了经济总量位居第二的显著成就。但是随着过去粗放型发展,伴随而来的是资源的日渐消耗以及环境的日渐恶化,这也成为了中国经济实现可持续发展的瓶颈。近年来保护环境已逐渐成为全社会各界的普遍共识,随着低碳经济和可持续发展理念的深入,中国政府在考虑经济发展对生态环境潜在影响的同时,认识到了在经济发展中进行产业结构化升级以及转变经济发展方式的重要性,将绿色金融加入到国家重
学位
随着素质教育的不断推进和深化,在小学体育教学中,安全教育的重要性越来越高,因此每个体育教师都应当针对体育课中所存在的各种安全问题来制订相应的解决策略,力求规避这些安全问题,保障学生在从事体育活动时的安全。具体而言,体育教师不仅要强化自身的安全教育观念,提高自身的安全教育水平,还要定期检修并维护体育器材,带领学生做好课前热身活动,并根据学生的具体身体状况制订个性化的训练目标,强化学生的安全意识,从而
期刊
随着互联网技术的飞速发展,互联网企业在人民生活和社会生产中承担着越发重要的角色。互联网企业独特的商业模式和资本结构,例如有大量的无形资产,通过资金的不断投入去占领市场而导致企业前期出现亏损等,决定了互联网企业的估值方式必将有别于传统企业。对于互联网企业的估值,其准确性一方面影响着企业经营者对于自身企业价值的认知,未来经营方式的选取;另一方面也影响着投资者对互联网企业进行投资时的判断和决策。所以如何
学位
我国股票市场上一直流传着“新股不败”的神话,这是因为新股上市首日往往能够收获巨大的涨幅,从而给投资者带来巨大的收益。然而这一现象在近几年有所改变,自科创板试行注册制以来,新股破发现象频频出现。2021年全年IPO首日破发个股达到22只,其中有10只皆来自科创板。大量IPO首日破发不仅让无数个人投资者遭受重创,而且破发所产生的联动效应往往会影响到其他公司,导致市场上的一些高质量公司难以筹集到公司发展
学位
在国家不断深化国有企业改革的背景下,混合所有制改革对优化国企治理结构、加快国企运行效率、提高国企创新能力而言,起到了至关重要的作用。目前通过混改加快国企转型升级步伐的进程如火如荼。2017年国家持续推进重点领域的企业进行混合所有制改革试点,中国联通被列为首批混改试点企业。中国联通作为关系国家网络强国战略及民生安全的关键央企,自成立以来就经历了电信行业不断改革变化的过程,成为了行业的三巨头之一,但在
学位
地方政府作为区域经济发展的主要推动者,通过举债投资刺激着各地经济飞速发展,但也埋下了地方政府债务风险隐患。近年来,重庆市积极推进基础设施建设,提升了地区经济活力,但同时也积累下大规模的地方政府债务,面临2021-2023年的偿债高峰期,债务风险存在超预期释放的可能。因此,本文以重庆市及各区县为研究对象,用定性和定量的方法研究重庆市及各区县地方政府债务风险。本文首先梳理了地方政府债务相关概念和相关理
学位