基于集成学习算法的老年代谢综合征早期识别预测模型研究

来源 :暨南大学 | 被引量 : 0次 | 上传用户:luwenfei7782
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代谢综合征是一个全球性的公共卫生问题,其临床症状得到有效控制,能明显降低脑卒中、心肌梗死等严重心脑血管疾病的发病率。在当前人口老龄化的时代背景下,亟需对代谢综合征早期识别问题进行的研究。本文根据广域多医疗中心数千份临床问卷资料,基于集成学习算法建立老年代谢综合征早期识别预测模型,并利用级联分类器原理对疾病预测模型的不足之处进行优化,以及利用SHAP框架对进行模型解释和特征重要性的研究,以此构建老年代谢综合征的高风险人群画像,进而对高风险人群进行早期干预以降低其代谢综合征发病率。本文着重进行了以下研究工作:(1)对样本数据进行预处理,并通过比较选择随机过采样作为处理数据不平衡问题的方法;(2)为提高预测模型准确率,通过构建不同的基线模型和集成模型,应用网格搜索结合交叉验证的参数调优方法,得出Cat Boost模型的拟合效果最佳,加权F1得分达0.9286;进一步通过定义分位数准确率以优化原有分类器的阈值划分方法,并基于级联结构对模型进行集成,级联后的模型加权F1得分达0.9375;(3)在模型解释方面,利用SHAP框架分别从局部和全局的角度进行模型解释和特征重要性研究,发现肥胖病史、高密度脂蛋白C、甘油三酯以及高血压病病史为对模型贡献最大的四个特征,且肥胖病患者、低高密度脂蛋白C含量、高甘油三酯含量以及高血压患者会增加代谢综合征的确诊概率。本文所提出的模型有利于提高疾病诊断预测模型的性能,以辅助医疗机构从业人员进行疾病诊断和制定精准的预防或治疗方案;同时为代谢综合征高危人群进行个性化模型可视化解释,丰富包括代谢综合征在内的复杂代谢系统疾病的高危人群特征标签,能够为决策部门制定老年健康政策的提供理论依据,为指导健康老龄化战略的实施提供科技支持。
其他文献
我国的A股市场具有显著的复杂性特点,如果仅仅依靠诸如基本面分析、技术分析等这样的传统分析方式进行研判和决策,想要获得可观的超额收益已经变得不那么容易了,然而结合信息时代的创新产物——量化投资,在一定程度上可以帮助投资者以更为理性、更为高效的方式进行投资决策。量化投资中最重要的一环便是量化选股模型,其一般是基于多因子模型而构建,多因子模型最主要的便是找寻各种各样的因子和股票的收益率之间所存在的关系,
学位
准确的销量预测是企业提升市场洞察能力、精细化管理能力以及融资能力的重要基础,也是企业成功的重要手段。现实世界中的销量数据通常表现为多层次时间序列,多层次时间序列预测的重要问题是如何保证预测结果的准确性和加和一致性。现有研究进行销量预测时,大多直接对各个序列作预测,较少考虑层次结构,预测结果虽然具备较高的准确性但是却不满足加和一致性。此外,多层次序列预测方法常常采用“两步走”策略,在这个过程中需要指
学位
“高等数学”是高等院校理工科专业必修的一门公共基础课程,它对学生后续的专业课程学习起着重要的辅助作用。近些年,随着云技术及人工智能的飞速发展,人类社会进入了大数据时代。大数据技术的产生对“高等数学”教学提出了新的挑战,同时也带来了新的机遇。本文通过对“高等数学”教学现状进行分析,找出大数据背景下该课程在教学或考核中存在的问题,结合自己的教学实践,从教学理念、教学内容、教学方法和考核方式四方面探讨“
期刊
新冠疫情反复以及国际关系局势变化使得全球经济市场呈现高度不稳定性,同期我国正大力发展内循环经济,构建以国内经济为主体的发展态势,形成促进国内国际双循环的新发展格局。但是,目前地方保护主义等因素催生的省际贸易壁垒限制了市场规模的发展,影响了各省技术发展的积极性,导致生产能力下降,进而影响了各省的经济增长。基于此,探讨我国省际贸易壁垒对于经济增长的影响,通过测算省际贸易壁垒并验证其影响效应,有利于重新
学位
学位
2018年底中央经济工作会议指出,要推动制造业高质量发展。2022年政府工作报告中再次强调了制造业企业核心竞争力的重要性。制造业从根本上决定了一个国家的综合实力和国际竞争力,然而研发投入不均衡以及创新质量低下的问题制约了制造业的转型升级。因此,基于我国制造业企业微观数据对研发和知识溢出的互补性进行分析,同时探究研发与知识溢出对制造业企业创新质量的影响效应,对于推动我国制造业结构优化和转型升级具有重
学位
随着信息化产业的高速发展,各类电信服务在人群中的普及率越来越高,且近年各电信运营商公司的兴起,加大了拓展新用户的难度,而做好用户留存,尽量减少用户流失就是最大化电信公司利润的必要手段。但是要尽可能减少用户留存的成本,就需要电信公司在庞大、复杂的数据中筛选出高价值而有效的数据信息,精准预测用户流失风险。论文聚焦于电信公司高价值用户流失分析的主题,首先根据用户生命周期理论划分数据集,基于此利用用户充值
学位
2021年中国金融深度指标值为美国的5倍,但固定资产投资等主要经济指标增长缓慢,表明注入市场的金融资源没有得到有效配置,大量金融资源因受到政府的隐性担保被流入到某些无效的生产部门或企业,从而影响企业绩效的发展。鉴于此,深入探究金融资源配置效率对制造业企业绩效的影响效应,能够帮助我国制造业企业了解如何更好的提升其金融资源配置效率,推进我国产业实现高质量转型升级,最终使得国家经济高质量发展有着显著的现
学位
为了增强新能源汽车产业的实力,我国将其纳入战略性新兴产业并予以重点扶持。近年来我国政府颁布了一系列财税政策。与此同时该行业也存在充电配套设备落伍和新能源汽车推广受阻等问题,因此政府逐步调整针对新能源汽车领域的财税政策。论文以财税政策对新能源汽车销量的影响研究为主题以探索财税政策的有效性和未来的优化方向。首先,论文研究财税政策对新能源汽车销量和市场占有率的影响。其次,论文还利用双固定效应模型研究传统
学位
学位