论文部分内容阅读
目的寻找新的更加有效的方法用于乙肝病毒性肝硬化的早期诊断和病程监测成为临床诊疗的迫切需求。随着代谢组学的发展,如何利用代谢组学方法更好地为医学实践和医学研究服务成为该领域的研究热点。本研究利用基于液质联用的代谢组学研究平台对乙肝病毒性肝硬化患者血清代谢轮廓进行了分析,对在临床病例研究中如何利用代谢组学方法研究疾病发生发展的内在机制、寻找可用于监测和评估疾病病程的特征代谢物,以及如何利用模式识别方法和机器学习方法建立基于特征代谢物的判别模型进行了初步探讨。方法利用高效液相色谱-轨道离子阱质谱联用平台分析19份正常人和81份乙肝病毒性肝硬化病人血清标本,其中肝硬化Child-Pugh A级37人、B级33人、C级11人。随机挑选出各组病例的20%组成检测组样本用于对模型的检测,不参与后期的数据分析,余下的样本作为训练组用于数据分析。首先利用主成分分析法(PCA)和正交偏最小二乘分析法(OPLS)对代谢轮廓数据的变异性进行分析,然后构建乙肝病毒性肝硬化不同Child-Pugh分级样本间血清代谢轮廓的正交偏最小二乘判别分析(OPLS-DA)模型,分别为:区分A级组和正常对照组、区分B级组和A级组、区分C级组和B级组的3个二分类OPLS-DA模型以及由这四组一同构建的1个四分类OPLS-DA模型,并利用检测组样本对这些模型进行检测;然后利用二分类OPLS-DA模型中的变量投影重要性值(VIP)、VIP图及系数图(coefficient plot)中变量的置信区间和非参数检验筛选出区分乙肝病毒性肝硬化不同Child-Pugh分级的特征离子,并对它们进行鉴定;最后基于这些特征离子构建区分肝硬化不同Child-Pugh分级间的二分类OPLS-DA模型和二分类支持向量机(SVM)分类器,分别为区分A级组和正常对照组、区分B级组和A级组、区分C级组和B级组的3个OPLS-DA模型和3个SVM分类器;并利用交叉验证法对这些模型的预测能力进行评估。结果经过分析发现,液质联用平台分析检测性能的“时间”偏移是影响实验结果最主要的干扰因素,但由于样本的随机进样,该干扰因素在各样本组间的影响得以抵消。利用血清代谢轮廓数据构建的4个OPLS-DA模型经7倍交叉验证均有很好的预测能力(Q2分别为89.5%,66.4%,90.3%,80.8%),4个模型对检测组样本的预测准确性均达到100%。共筛选出157个特征离子,经过数据库搜索和结构推导,67个得到了鉴别。这67个代谢物分别有氨基酸代谢产物、胆汁酸代谢产物、维生素代谢产物、激素代谢产物和脂类代谢产物,其中磷脂类物质比例最高,有26个。而溶血磷脂酰胆碱就古到15个(结合不同长度和不同饱和度的脂肪酸),且水平随肝硬化程度的加深呈递减趋势。利用这197个特征离r构建的3个二分类OPLS-DA模型拥有更好的预测能力(Q2=90.4%,72.8%,93.4%);3个二分类支持向量机(SVM)分类器灵敏度、特异度以及对检测组样本的区分正确率均能达到100%。结论(1)证实了经过合理的实验设计和对样本分析顺序进行随机分配,可以抵消非实验因素对血清代谢轮廓的影响。(2)建立了利用OPLS-DA模型寻找区分不同程度肝硬化的特征代谢物的方法。(3)经过对鉴别出来的代谢物的分析,我们发现利用基于液质联用平台检测血清中溶血磷脂轮廓的变化可能成为监测和评估乙肝病毒性肝硬化进程更加有效的手段。(4)基于本液质联用平台的特征离子的OPLS-DA模型和支持向量机(SVM)分类器可以作为评估乙肝病毒性肝硬化进程的新方法。