基于治疗前基线数据的HIV一线抗病毒治疗病毒学失败预测模型研究

来源 :中国医科大学 | 被引量 : 0次 | 上传用户:cdhanks1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:人类免疫缺陷病毒(human immunodeficiency virus,HIV)感染目前仍是全球的一个主要公共卫生问题,尚无可行的艾滋病根治方法,因此通过抗逆转录病毒治疗(antiretroviral therapy,ART)抑制HIV感染者的病毒复制至关重要。ART病毒学失败(virologic failure,VF)产生的原因之一是治疗药物的副作用较多,影响患者的服药依从性,且长时间的治疗可能会使患者出现耐药性和治疗疲劳。建立一种HIV一线抗病毒治疗VF预测模型识别VF风险较高的患者,有利于提高患者的ART依从性,促进HIV监测和治疗资源的合理分配。现有的VF预测模型都需要根据患者ART后的随访数据才能进行预测,并且部分预测因子如依从性信息,获取难度较大且准确性难以保证,限制了模型的临床应用;另外现有研究收集到的ART前基线信息较少,VF患者ART前的基线特征尚不明确。本研究的目的是利用机器学习(machine learning,ML)和统计学算法根据HIV患者治疗前的基线数据开发和验证一线抗病毒治疗VF预测模型,并进行风险分层,提高患者ART依从性,帮助临床医生实现对HIV患者的个性化监测和治疗,促进资源的合理分配。同时,本研究还将通过对比多种建模方法得到的预测因子,综合分析各因子的预测能力和风险水平,为艾滋病的基础和临床研究提供新的研究方向。研究方法:1、研究对象:2002-2018年中国医科大学附属第一医院包括2225名患者的开放式HIV-1感染治疗队列。收集ART前患者的基线人口学、临床、实验室信息,以及ART后病毒载量(viral load,VL)检测、ART方案更换信息。2、建立预测模型:按照7:3的比例随机划分训练集和验证集,在训练集上使用Cox比例风险模型(Cox)和ML算法分别建模。Cox模型:选择单因素分析P<0.1和以往研究中有研究意义的变量进行逐步回归构建模型。ML模型:采用遗传算法(genetic algorithm,GA)分别对支持向量机(support vector machine,SVM)(非线性核、线性核)、随机森林(random forest,RF)和logistic回归(LR)4种ML算法进行优化,选择最佳的变量组合构建模型,使用5折交叉验证优化模型参数。在验证集上对包括Cox在内的5种模型的性能进行验证。同时,考虑到HIV治疗资源分布的不平衡性,我们还采用验证集中受试者工作特征曲线(receiver operating characteristic,ROC)下面积(the area under the ROC curve,AUC)最高的GA+SVM(非线性核)算法重新构建了一种不包含“ART方案、VL、CD4计数(CD4)、CD4%、CD8、CD8%、CD4/CD8”的VF预测模型。3、模型评价:通过AUC、敏感度、特异度评价模型的预测性能,用校准曲线校准模型。4、人群风险分层:选择AUC最高的GA+SVM 7变量模型,利用训练集上的预测概率使用X-tile分析和Kaplan-Meier曲线确定低、中、高风险人群的最佳截断值,在验证集上验证截断值的统计学意义。5、比较预测因子的预测能力、确定风险水平:将训练集上Cox模型中单因素分析P<0.1的变量和其他ML算法选择出的预测因子在全部的数据上进行ROC分析,用AUC比较各变量的预测能力;采用Cox比例风险模型将上述变量排除共线性影响后用enter法进行多因素分析,明确风险水平或类型。结果:1、变量的选择及模型的建立:本研究纳入了2225名HIV患者ART前的基线特征,在训练集和验证集上一线ART病毒学失败的发生率分别为8.2%和6.9%(P=0.277),中位观察时间分别为3.04年和3.21年。在统计学和ML模型中AUC最高的为GA+SVM(非线性核)模型(AUC=0.80),包括CD4、CD4%、CD8%、天门冬氨酸氨基转移酶、白蛋白(albumin,ALB)、混合细胞群%和男性7个变量,在ROC曲线和校准曲线上分别展示了较好的识别能力和校正准确度;其他模型的AUC分别为GA+RF模型0.78,Cox模型0.75,GA+LR模型0.75,GA+SVM(线性核)模型0.73。因此本研究又选择用GA+SVM(非线性核)算法构建了针对HIV治疗资源匮乏地区的GA+SVM 9变量模型,包含混合细胞群%、混合细胞群、低密度脂蛋白胆固醇、ALB、总蛋白、肌酐、平均红细胞体积、血小板分布宽度和平均血小板体积,AUC为0.72。2、GA+SVM 7变量模型在患者风险分层中的应用:在训练集中,GA+SVM7变量模型的预测概率被分为低、中、高3个风险等级,分别反映≤34%、34-73%和>73%的VF风险水平:与低、中风险人群相比,中、高风险人群的HR(95%CI)分别为5.16(3.24,8.23)和2.54(1.71,3.77)。在验证集中,67.7%的患者被确定为低风险,观察VF率为2.4%;22.1%被确定为中风险,VF率为14.2%;10.2%被确定高风险,VF率为20.6%。与低、中风险人群相比,中、高风险人群的HR(95%CI)分别为5.73(2.76,11.90)和1.47(0.75,2.89)。3、一线ART病毒学失败的预测因子及风险水平:CD4/CD8、CD4、VL、CD8%、CD4%、混合细胞群%的AUC较高,均≥0.65,其中混合细胞群%的AUC为0.65,是除CD4、CD8、VL等传统因素外,预测能力最强的预测因子,混合细胞群%>7.7%的HR为2.38(95%CI 1.66-3.42,P<0.001,vs.≤7.7%)。此外,研究还发现高密度脂蛋白胆固醇(high-density lipoprotein-C,HDL-C)水平越低,患者发生VF的风险越大,变量的AUC为0.60,风险水平为<0.7 mmol/L。结论:1、本研究首次完全基于ART前的基线数据建立了一个具有较高的预测能力的一线抗病毒治疗VF预测模型,并且实现了对患者的低、中、高风险分层,有利于帮助临床医生实行个性化的监测和治疗策略。同时我们还建立了一个完全基于人口学、血常规、血清生化检测信息的GA+SVM 9变量模型,用于VL、CD4等相关检测不普及的国家和地区,提高了VF预测模型的可应用范围。2、混合细胞群%具有较强的VF预测能力,对VF模型在HIV监测资源匮乏地区中的应用可能有着重要的临床意义。3、本研究首次发现了ART前低水平的HDL-C会增加VF的风险性,并且初步明确了HDL-C的风险水平。
其他文献
高校实验室危险废弃物种类多、成分复杂,是实验室安全工作的重难点。加强实验室危险废弃物规范化管理,为创建平安校园、绿色校园提供有力保障。基于此,阐述了高校实验室危险废弃物的定义与分类,分析了其管理的必要性和目前存在的问题,探讨了实验室危险废弃处理原则和规范化管理措施,以实现危险废弃物的安全环保、规范高效处置。
期刊
目的:获得性免疫缺陷综合征(Acquired Immune Deficiency Syndrome,AIDS)是由人类免疫缺陷病毒(Human immunodeficiency virus,HIV)感染引起的一种传染性疾病。HIV感染后损害天然免疫和获得性免疫系统,免疫细胞数量和功能发生变化,影响了抗病毒的能力。自然杀伤细胞(Natural Killer,NK)细胞是机体抗肿瘤和抗感染的第一道防线
学位
目的:激光技术已广泛应用于临床治疗病理性瘢痕(pathologic scar,PS),但关于其治疗PS的证据有限,相关研究多为回顾性分析,结论不一,且缺乏总结性分析。因此,本研究意在评价不同激光治疗PS的有效性和安全性,期待研究结果将有助于临床决策并指导未来PS领域的研究。方法:在Pubmed、EMBASE、Cochrane Library、CNKI数据库中检索激光治疗PS的随机对照实验(RCT)
学位
背景及目的:脑卒中具有高复发率、高致残率和高致死率的特点,吞咽障碍作为脑卒中后严重并发症之一,发病率达37%~78%,可导致营养不良、误吸、脱水、肺炎,甚至死亡,严重影响患者生活质量和生存率。有研究发现早期识别和干预吞咽障碍会降低不良并发症的发生,国内外学者关于卒中后吞咽障碍的危险因素及预后等方面进行了大量研究,但很多方面尚无统一定论。因此本文对141例急性缺血性脑卒中后吞咽障碍患者(Post-s
学位
据世界卫生组织发布的统计数据(GLOBOCAN 2020)显示,2020年在全球范围内女性乳腺癌的诊出率已经超过肺癌,是最常见的癌症,估计有230万新发病例,占所有癌症病例的11.7%,且是癌症死亡的主要原因[1]。在我国,乳腺癌取代肝癌成为第四大最常见癌症,新病例数从2015年的30万增加到2020年的42万,死亡人数约占全球乳腺癌死亡人数的18%[2]。尽管近些年在乳腺癌的筛查、诊断和治疗方面
学位
背景:脑脊液(concentration in cerebrospinal fluid,CSF)中可溶性髓样细胞触发性受体-2(soluble triggering receptor expressed on myeloid cells 2,s TREM2)水平升高与认知功能损害密切相关,并与β-淀粉样蛋白(β-amyloid,Aβ)、总tau蛋白(total tau,T-tau)、磷酸化tau蛋
学位
研究目的:腹主动脉瘤(abdominal aortic aneurysm,AAA)的破裂率较高,严重威胁着人类健康,给患者带来巨大的经济负担。目前,AAA的治疗仅限于开放手术和腔内修复,缺乏有效的药物预防和治疗。此外,AAA的发病机制较为复杂且尚不明确。许多研究发现肠道菌群及其代谢产物在心血管疾病中发挥着重要作用,但其在AAA发病机制中的影响未见报道。因此,我们将探索肠道菌群代谢产物氧化三甲胺(t
学位
目的:帕金森病(Parkinson’s Disease,PD)与多系统萎缩(Multiple System Atrophy,MSA)临床表现复杂多样且多有重叠,临床易误诊。本研究采用影像组学结合机器学习方法,探究基于磁敏感加权成像(Susceptibility weighted imaging,SWI)序列的壳核及黑质的影像组学特征结合机器学习模型能否有效鉴别PD与MSA。方法:连续收集满足纳入排
学位
目的:外伤、先天畸形、手术等因素导致的软组织缺损和局部组织凹陷畸形是整形外科领域一直亟待解决的问题。近些年来,为解决组织量缺失的问题,各种人工填充材料不断被探索改进,与人工材料相比,自体脂肪材料因为排斥反应小、相容性好、提取方便等优势,而成为安全有效的填充物,已用于修复软组织轮廓畸形、乳房再造、毛发再生、抗衰除皱等,但自体移植物的不可预测性、高吸收率等问题也随之出现。脂肪移植物中的主要细胞包括脂肪
学位
目的:低级别胶质瘤的患者的治疗方式非常个体化,放疗作为其术后的常用辅助治疗手段并不能使所有患者受益,本研究拟构建一种生物标记来筛选放疗获益的患者,同时预测接受放疗的预后生存情况。方法:本研究使用CGGA和TCGA数据库中,共分析了 493名被诊断为低级别胶质瘤的患者。采用ssGSEA分析了错配修复通路的表达情况,并按照表达水平将患者分为MMR高组和MMR低组。放射获益组(RS)和放射非获益组(RR
学位