【摘 要】
:
针对艾滋病相关隐球菌性脑膜炎死亡率极高的问题,本文在相关数据集上建立了三个基于XGBoost的生存预测模型(BecCox、EXSA、Hit Boost)。通过对比上述模型和Cox比例风险模型(CPH)的预测性能,找出了准确率较高的死亡率预测模型,对其预测结果产生机制进行了解释,并利用该模型判别处于高风险中的患者,为采取措施降低患者死亡率提供了理论依据。进一步丰富了机器学习在生存预测模型中的研究课题
论文部分内容阅读
针对艾滋病相关隐球菌性脑膜炎死亡率极高的问题,本文在相关数据集上建立了三个基于XGBoost的生存预测模型(BecCox、EXSA、Hit Boost)。通过对比上述模型和Cox比例风险模型(CPH)的预测性能,找出了准确率较高的死亡率预测模型,对其预测结果产生机制进行了解释,并利用该模型判别处于高风险中的患者,为采取措施降低患者死亡率提供了理论依据。进一步丰富了机器学习在生存预测模型中的研究课题。首先,本文以艾滋病相关隐球菌性脑膜炎患者的临床试验数据--ACTA数据集为研究对象。在数据清洗、缺失值填补、特征提取处理的基础上,对比了基于XGBoost的生存预测模型BecCox、EXSA、Hit Boost以及传统的CPH模型预测性能的优劣。结果表明,在ACTA数据集上BecCox模型在预测准确度方面有较好的表现,平均一致性指数为0.746,比CPH模型的平均一致性指数高出5.8%。除此之外,模型还识别出影响艾滋病相关隐球菌性脑膜炎的关键因素为脑脊液酵母菌数量、血红蛋白含量和血清葡萄糖水平。丰富了基于XGBoost的生存预测模型在艾滋病相关隐球菌性脑膜炎数据集上的研究和结论。其次,本文引入SHAP模型从整体和个体两个角度对BecCox模型的预测值产生机制进行了解释。在BecCox模型研究的基础上,丰富了BecCox模型可解释性方面的研究和结论,提高了医疗保健领域创新生存预测模型的信任度。最后,本文借助自然间断点聚类算法进行聚类个数的选择,基于BecCox模型的预测结果对患者进行了风险评级,并且在测试集上验证了风险评级结果的合理性。比较了不同的风险组在不同治疗方式下的平均生存率,得到了每一个风险组的最优治疗方式,所得结果可以作为辅助信息,辅助医生进行临床治疗。丰富了患者风险评级方面的研究和生存预测模型的应用。
其他文献
跨学科主题学习是以培养学生综合运用所学知识和方法解决实际问题为目标展开的学习方式,具有学科性、境脉性、协作性和融合性等特征。在数学教学中,教师可以通过确立真实性主题、梳理结构化内容、解构递进式任务,围绕大概念的理解展开整合性评价,逐步培养学生的核心素养。
为进一步发挥地理研学旅行的综合实践育人价值,本文围绕“区域发展”主题,融合历史、政治、美术等学科,提出基于跨学科主题的地理研学旅行策略。本文选取湖北省黄石市国家矿山公园为研学地点,从研学主题、研学目标、学科融合、研学路线、研学活动、研学内容、研学评价等七个方面进行案例设计,为基于跨学科主题学习的地理研学旅行的设计提供一种新的思路与方法。
西河滩遗址是我国西北地区发现的新石器时代晚期聚落遗址,也是有关四坝文化内涵的遗址,文化遗存丰富,记录着酒泉地区史前文化、人居环境、聚落形态、人群迁徙、文化交流等各方面信息,具有非常重要的历史价值。首先做好遗址保护是最基本、关键的问题,全面保护遗址本体和景观风貌,再者深入挖掘西河滩遗址的历史、科学和艺术价值,通过开发利用有效实现遗址的社会经济价值,使遗址保护利用与当地发展和民生改善相协调。大遗址保护
脑肿瘤具有高发病率且易致死,是严重危害人类健康的疾病之一,由神经胶质细胞癌变引发的胶质瘤则是最常见的颅内脑肿瘤。随着医学成像技术、高性能计算机及深度学习算法的不断发展,医学图像处理在脑肿瘤疾病的诊断治疗方面发挥着越来越重要的作用。核磁共振成像(Magnetic Resonance Imaging,MRI)是医学上最重要的成像手段之一,其成像环境无电离辐射且是非侵入性的,同时还具有成像分辨率高,软组
心律失常自动识别对于心律失常的及时诊断与治疗具有重要的临床意义。识别心律失常的一个重要依据就是其在心电图(Electrocardiogram,ECG)上的异常表现。但由于心律失常的类型较多,且不同类之间的ECG异常表现会重复或具有很高相似性,使得已有的基于机器学习的心律失常识别方法对于多类心律失常的识别效果不理想。在上述背景下,本文提出了两种新的基于深度学习的心律失常自动识别方法。首先,本文分别提
在临床上,脑电图是研究脑科学的重要工具,也是评价脑功能状态的一个指标,它广泛应用于神经系统疾病以及精神疾病的诊断评估。如今分子生物学和神经影像学等技术快速发展,涌现出许多新的技术,推动了临床诊断以及神经科学领域的研究,但神经电生理技术在探讨脑功能的活动规律及各种疾病的辅助诊断等方面仍有其特有的优势。全麻是通过麻醉药物使中枢神经系统产生暂时抑制的模式。临床表现为全身痛觉消失、失去记忆、肌肉松弛,其基
青铜文物为历史文明的研究提供重要的物质支撑,在基本建设考古前置背景的影响下,青铜文物的出土量日益剧增,随之而来的现实问题便是对于脆弱青铜器的保护研究有待进一步的突破。脆弱青铜器的研究与保护离不开大量的实物标本以及科学的分析检测,鉴于器物脆弱易损的特点,所采集的脆弱青铜器标本更显得尤为珍贵,如何提高标本的利用率,如何科学的存储、管理、利用标本以及进行相关的科学研究,是本研究的重点思考方向。本文的主要
我国西部地区拥有丰富的水资源、有大量的水利水电工程建设,大部分区域都以农林、畜牧业为主要经济产业,径流预测对该区域经济发展规划非常重要。传统径流预测多是基于成熟的水文循环模型,但是径流值的影响因素非常多,各因素之间存在复杂的关系,其预测准确率高度依赖其他因素。而近年来较为热门的机器学习模型又很少结合气象因素等特征,只基于径流值本身的数据规律来进行预测,所以预测效果还有提升的空间。基于以上的问题,本
从第一款数据库管理系统——Integrated Data Store(IDS)的诞生到如今数据库市场的百花齐放,短短几十年,数据库领域发生了翻天覆地的变化。究其背后的原因,在于PC和移动设备市场的欣欣向荣以及21世纪的信息大爆发。近年来,随着新一轮的数据增长,各种非结构化数据占比不断增加,互联网信息数据的网状形态愈发凸显,而埋藏在网状结构下各种有价值信息的挖掘也成为人们关注的焦点。图数据库相较于关
近几年人工智能在图像识别上拥有了越来越多的应用,但是依然存在很多挑战,长尾分布问题就是目前存在的最流行的挑战之一,长尾分布的数据让模型对头部类别的效果远远好于对尾部类别的效果。目前用于解决长尾分布问题的多专家学习中存在着以下两个问题:第一就是在多专家学习策略中,多个专家之间的部分专家会存在间距很近的情况,导致多个专家学习到的知识总和就更少。第二就是现有的多专家网络中的每个专家所学习的知识是不可控的