机器学习在发热待查病因类型预测中的应用

来源 :重庆医科大学 | 被引量 : 0次 | 上传用户:gjj19901005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:发热待查(fever of unknown origin,FUO)病因复杂,仍然是临床医生面临的主要挑战。本研究通过筛选鉴别儿童FUO病因类型为感染性疾病或非感染性疾病的独立危险因素并建立机器学习(machine learning,ML)模型。同时,探讨成人经典型FUO病因分布及不同病因类型下成人经典型FUO患者临床指标的差异,建立基于临床指标的ML模型。旨在帮助临床医生在儿童FUO以及成人经典型FUO的病因诊断中做出合理决策,提高诊断精度和降低误诊率。方法:通过重庆医科大学附属儿童医院临床大数据平台,收集2015年1月至2019年12月符合儿童FUO诊断标准的873例住院患儿的临床资料。采用SPSS 26.0软件进行单因素分析和Logistic回归分析并筛选出独立危险因素,以此分别构建Logistic回归、BP神经网络(back propagation neural network,BPNN)、支持向量机(support vector machine,SVM)、随机森林(random forest,RF)和轻型梯度提升机(light gradient boosting machine,Light GBM)5种ML模型。评估并比较5种ML模型的准确率(accuracy,ACC)、受试者工作特征曲线下面积(area under the receiver operating characteristic curve,AUROC)和F1值3个指标。同时,收集2012年1月至2021年8月重庆市6家医疗机构收治的符合成人经典型FUO诊断标准的527例患者的临床资料。将最终确诊的373例患者按照经成人经典型FUO常见的4种不同病因类型分为4组,进行统计分析,筛选出不同病因类型下具有统计学差异的指标。在这些指标的基础上,构建并评估了5种ML模型,即RF、SVM、Light GBM、BPNN和朴素贝叶斯(naive Bayes,NB)模型,使用5折交叉验证评估所有数据集,并用micro-F1值评估比较模型性能。结果:本研究收集到儿童FUO共873例,单因素分析结果显示41项指标差异有统计学意义(P<0.05)。采用Logistic回归分析筛选出年龄、钠离子等8项独立危险因素,基于筛选出的指标构建5种ML模型。Logistic回归、BPNN、SVM、RF、Light GBM的ACC依次为0.748、0.769、0.803、0.800、0.784,AUROC为0.751、0.784、0.806、0.776、0.796,F1值为0.856、0.864、0.877、0.873、0.871。相比之下,SVM模型各评价指标均略高于其他算法模型。同时,将明确诊断的373例成人经典型FUO患者按标准分为4种不同的病因类型组:感染性疾病组(n=277)、非感染性炎症性疾病(non-infectious inflammatory disease,NIID)组(n=51)、肿瘤性疾病组(n=31)和其他疾病组(n=14)。由于部分患者出院时发热原因仍未明确,因此另外154名患者被归类为未明确诊断组。4组不同病因类型的经典型FUO患者在性别、年龄等18项指标上存在显着差异(P<0.05)。Light GBM的micro-F1得分为75.8%,高于其他四个ML模型,预测模型的性能最好。结论:年龄、乳酸脱氢酶等8个指标是鉴别儿童FUO病因类型为感染性疾病或非感染性疾病的独立危险因素。在Logistic回归、BPNN、SVM、RF和Light GBM5种机器学习模型的评估和比较中,SVM的分类预测效果更优。临床上使用患儿入院时易获得的各项指标,即可较准确地预测儿童FUO病因类型,以提供给临床医生最有可能的病因诊断方向,为临床进一步明确诊断提供决策依据。感染性疾病仍是经典型FUO的主要病因类型。基于性别、年龄等18个具有统计学意义的临床指标,我们构建并评估了5种ML模型。其中,Light GBM对经典型FUO病因类型的预测效果较好,将起到很好的辅助决策作用。
其他文献
目的:2型糖尿病患者的慢病管理已经成为了全球公共卫生的难题与挑战,我国已有超过1亿名糖尿病患者。2型糖尿病患者发生致死性心血管风险是远高于非2型糖尿病患者。但是在最严重的冠心病风险评估中,传统的诊断方式都存在一定的缺陷,再则2型糖尿病患者痛阈值较高,心绞痛症状难以察觉,患者很难接受专门的冠心病检查。而随着医院电子病历的广泛使用,以及医疗大数据平台的研发,医学数据以指数级的速度积累。机器学习广泛运用
学位
小细胞外囊泡(sEV)是一种脂质包裹的天然生物纳米材料,可参与细胞间信息交流。sEV由于其内携带特定的生物信息分子可应用于肿瘤液体活检。常用于sEV分离的方法为超速离心法和共沉淀法。然而,它们存在以下缺点:繁琐耗时的操作步骤,所需样本量较大,且分离出的sEV无特异性。本研究为了结合暴露于sEV表面的磷脂酰丝氨酸(PS)实现肿瘤源性的sEV亚群的捕获,首次利用T免疫球蛋白结构域和黏连蛋白结构域4(T
学位
背景:根据《健康中国行动(2019-2030)》文件显示,2018年中国儿童和青少年的总体近视率为53.6%;其中6岁儿童近视率为14.5%,小学生为36.0%,初中生为71.6%,高中生为81.0%。新冠疫情自2019年12月以来在全世界范围内传播,中华人民共和国教育部调查了疫情期间九个省(自治区、直辖市)中小学生的视力变化,发现与2019年底数据相比,6个月的时间内中小学生近视率上升11.7%
学位
传统意义上人们对骨重塑的理解是成骨细胞和破骨细胞的共同作用,但是骨细胞直接参与骨质量的维持作用却一直被忽视。骨细胞及其树突在骨基质中通过骨陷窝-小管系统(Lacunar-Canalicular System,LCS)跨越整个骨基质,与其他邻近骨细胞、成骨细胞、破骨细胞和血管等组织细胞直接交流,这使得骨细胞能够协调各种细胞间的活动,以适应机械需要和激素变化。骨细胞除了通过调节成骨细胞和破骨细胞间接参
学位
随着我国社会经济水平的提高和居民饮食结构的改变,近几年心血管疾病的发病率在逐渐上升。此外,由于社会工作压力和不良生活习惯等因素,心血管患病人群呈现年轻化发展趋势。心血管疾病作为一种慢性疾病,无疑给家庭带来严重的经济负担,也是导致国人过早死亡的主要原因,而如何做好心血管疾病的早期预防,降低心血管疾病的发生,定期进行心血管疾病检查是目前最有效的防治措施。因此,一套可获取多个生理参数的便携式心血管检测设
学位
目的:脑梗死是一种常见且危害性极大的慢性疾病,其起病急骤,发病机制复杂,病情发展快,易引发死亡。学者普遍指出高血压是诱发脑梗死的首要独立危险因素,而目前临床上对脑梗死常规的诊断方法包括头颅CT、常规或多模态MRI检查、颈动脉超声、CTA、DSA等,但这些检查均是在出现明显脑梗死症状后才能确诊脑梗死,不利于在早期筛查原发性高血压患者的脑梗死患病风险。本研究结合患者的一般资料、病因和实验室检查指标构建
学位
目的筛选慢性阻塞性肺疾病急性加重患者发生Ⅱ型呼吸衰竭的危险因素,并以此建立预测模型,为疾病发生早期提供预警。方法选取重庆医科大学7家附属医疗机构2014年1月1日-2020年12月31日收治的因慢阻肺急性加重就诊的40岁以上患者1252例,根据住院期间是否发生Ⅱ型呼吸衰竭分为病例组(242例)与对照组(1010例)。单因素分析和“套索算法+多因素logistic回归分析”用于筛选独立危险因素。RF
学位
第一部分NR3A亚基在抑郁、焦虑样行为中的作用探讨目的:研究抑郁模型小鼠NMDA受体3A亚基(NR3A)的变化及敲除NR3A后对小鼠抑郁焦虑样行为的影响,以探讨NR3A在抑郁、焦虑中发挥的可能作用。方法:选取7至8周龄C57BL/6N小鼠37只,随机分为对照组(n=17)和CRS模型组(n=20),模型组进行为期2周的慢性束缚刺激,对照组不做任何干预,刺激结束后测量2组小鼠体重,用强迫游泳实验和糖
学位
天然产物活性成分往往含量很低,现有天然产物筛选方法对于微量活性成分的发现效率有限。磁珠固定化酶具有稳定性强、重复性好、易于分离等特点,已广泛应用于天然产物的活性成分筛选。结核分枝杆菌异柠檬酸裂解酶(Mycobacterium tuberculosis isocitrate lyase,Mt ICL)是休眠结核菌乙醛酸循环必须酶,是清除休眠结核菌关键靶之一。本课题组前期建立的基于磁珠固定靶蛋白迭代筛
学位
背景:骨质疏松性骨折是老年骨质疏松性患者的最常见的严重并发症,在我国人口老龄化进程中,该病的发生率也逐年升高。目前,经皮穿刺椎体成形术(PVP)是治疗骨质疏松椎体压缩性骨折(OVCF)应用最广泛的手术治疗方法,具有费用低、操作简单、创伤小、效果显著、迅速康复的优点,但仍有部分患者接受PVP术后腰背痛症状无明显改善,或短期缓解后再次出现明显腰背部疼痛。目的:本研究旨在探讨经皮穿刺椎体成形术后骨水泥分
学位