基于机器学习的冠心病患病风险预测研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xin22431
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
冠心病发病人数持续增加,发病年龄不断前移,现有筛查方法存在一定的局限性,使得冠心病患病风险预测和个人冠心病患病风险因素识别越来越被人们所关注。通过机器学习模型对冠心病患病风险进行预测和居民个人患病风险因素识别有助于尽早筛查出冠心病患者,尽早治疗,降低冠心病给个人和家庭带来的危害,也有利于居民进行日常的健康管理。在学习现有机器学习算法的基础上,以尽可能多的识别出冠心病患者为目的,针对冠心病预测具有的数据分布不平衡、预测错误代价不同的特点,对AdaBoost模型进行改进,并通过SHAP方法对改进后的模型进行解释,实现了对冠心病患病风险的预测和居民个人风险因素的识别。为了更好地构建分类模型,进行了如下工作。首先,在特征构建方面,针对诊疗数据采用关联规则挖掘的方法,识别出和冠心病相关的其他疾病,并将诊断次数作为特征加入模型中。其次,在数据处理方面,对现有数据进行预处理,按照8:2的比例进行训练集和测试集的划分,并在训练集上采用多种方法进行特征筛选。再次,在冠心病患病风险预测方面,针对不平衡数据集,改进了AdaBoost模型,并对比了该模型、现有的针对不平衡数据集改进模型和基于采样的其他机器学习模型表现。最后,在模型解释方面,采用SHAP方法,识别对预测冠心病患病风险的重要因素和各个因素的贡献方向,同时输出居民个人冠心病风险因素。结果表明,本文改进后的AdaBoost模型在召回率和AUC值上表现最优,相较于其他模型更适用于冠心病患病风险预测这一研究问题。对预测冠心病患病风险最重要的五个因素为曾诊断心肌缺血的次数、年龄、曾诊断高脂血症的次数、曾诊断高血压的次数和血清总胆固醇值。
其他文献
网络互助是利用互联网的信息整合功能和便捷支付功能实现传统互助共济的一种新型风险保障形式。2020年,国家机关发文要将网络互助与其他健康保障模式共同纳入医疗保障体系,强调了网络互助的重要作用。自网络互助诞生以来,不断有学者对其展开研究,但现阶段的研究多从法律,平台运行模式等视角出发,极少有研究关注用户对网络互助平台使用意愿的影响因素。本文在结构保障、信任理论和效价理论的基础上,引入网络互助的平台特征
学位
本文的研究目的是将随机森林算法引入以往的多因子模型中,构造基于随机森林分类算法的多因子选股模型,并以此为基础选出具有投资空间的资产构成资产池,以试图获得超额收益。本文以全部科创板上市公司为样本,选用原始因子和构造因子两大类共15个指标,选取从2020年元旦到2022年元旦共24个月,105组周数据构建原始样本,经过数据预处理共获得300组有效样本数据。其中以2020年元旦到2021年二季度结束共1
学位
股市作为支撑经济发展的重要工具,其重要性不言而喻。然而,因为股市中的投资者并非完全理性,导致股票市场异象频发。盈余公告后的股价漂移现象就是一种典型的股市异象,它代表着投资者对盈余公告发布事件没能做出合理的反应,使得盈余公告中的信息没有快速被股市吸收,股票价格不能真实地反应公司的实际价值,降低了股市的有效性。为了避免这种金融异象,需要知道如何调控投资者对盈余公告的反应程度。本文从外界信息影响投资者的
学位
采用焊接热模拟技术制备了低合金高强钢双道次激光电弧复合焊热影响区的均匀化组织试样,研究了二次峰值温度对热模拟试样微观组织和韧性的影响。结果表明,未转变粗晶区为粗大的板条马氏体,晶粒尺寸在84~98μm之间。超临界再热粗晶区为细小的板条马氏体,晶粒尺寸为15.7~19.2μm。临界再热粗晶区为晶界和亚晶界分布有块状M-A组元的板条马氏体。亚临界再热粗晶区组织为板条马氏体,晶粒尺寸在79~88μm之间
期刊
远缘杂交和基因工程是种质创新的主要途径。本研究总结了菊花的16个近缘属、17个近缘种种质,依据前人的杂交实验结果,分析野生种质与菊花亲缘关系的远近,发现亚菊属、春黄菊属和小滨菊属等6个属与菊花的亲和性较强,野菊、紫花野菊、毛华菊、甘菊与菊花之间的亲缘关系较近,有6个属和11个种的种质与菊花之间的亲缘关系还不明确。阐述菊花基因工程育种在观赏性状和抗性性状改良方面的成果,建议开展更广泛的杂交试验和基因
期刊
报纸
处理危机是当代社会面临的最重要和最复杂的任务之一。危机往往会对个人、机构和社会带来高风险的局面,包括死亡、伤害、经济损失、破坏和混乱等严重后果。风险沟通对于改进危机事件应急管理,提高政府和卫生部门的权威,改善民情,以及促进社会稳定等方面具有重要作用。有效应对新冠肺炎疫情等危机,取决于公众自觉遵守政府规定和指导。因此,选择一种有效的信息传递方式以激发公众对政府风险沟通措施的积极态度,促进公众自觉遵守
学位
随着移动通信技术的不断发展,直播开始运用于在线购物场景,一种新的电商模式——直播电商随之出现。经过2020年疫情的冲击,中国直播电商全面爆发,迅速成长壮大,形成“全民带货”的浪潮。随着直播电商的发展,直播电商行业逐渐出现主播类型多元化、直播场景多样化的现象,而商家带货也呈现“马太效应”。目前国内外对于直播电商的研究很少基于商家视角系统化研究消费者购买意愿的影响因素,并且很少运用定性比较分析法(QC
学位
在网络信息技术超速发展的当代社会,人类之间交流信息的主要平台已逐渐从远古时期的飞鸽传书变为现代的社交网络。社交网络既丰盈了人们的内心世界,又为人们的生活提供了诸多便利。然而凡事都有两面性,社交网络在为信息传播提供更加多元化的渠道的同时也给个人信息安全带来了一定的风险。因此,社交网络用户需要提高对信息安全保护的认识以及对信息风险的了解,培养自我保护的能力。本文基于详尽可能模型,对社交网络中信息安全知
学位
随着网络购物的蓬勃发展,越来越多的消费者开始在网络上购物并撰写评论。此外,随着物流技术的发展,物流成本越来越低,买家的退货行为不再是偶发行为。目前为止,对商品的评论和买家退货行为的研究侧重于评论对退货的影响上,而关于退货对在线评论的影响以及在线评论和退货行为如何联合影响卖家的均衡定价和收益仍存在较大空缺。因此,本文主要研究了在线评论和退货对厂商产品定价策略的交互影响。本研究基于一个在线交易的平台,
学位