论文部分内容阅读
目的:先天性心脏病(congenital heart disease,CHD)是最常见的先天性畸形,胎儿的超声检查在CHD的产前诊断中起着至关重要的作用,但是由于操作者的经验、胎儿胎位等各种因素的影响,临床上常出现漏诊。本论文旨在通过代谢组学的手段找到胎儿CHD的生物标志物,为临床上CHD的产前诊断提供参考。方法:1.基于核磁共振(~1HNMR)的非靶标代谢组学技术对60例经超声诊断且随访胎儿为CHD的孕妇(CHDP组)与60例健康胎儿孕妇(NCP组)的血清样本进行检测,建立了四种多元统计模型,并对其鉴别诊断性能进行考察,筛选出区分两组的差异代谢物,找到其影响的代谢通路。2.基于液质联用(UPLC-MS)的靶标代谢组学技术对86例CHDP与92例NCP血清中的氨基酸类代谢物进行定量分析,利用二元Logistic回归模型联合ROC分析筛选CHDP血清中的氨基酸类诊断生物标志物组合。3.基于UPLC-MS/MS的靶标代谢组学技术对55例CHDP与49例NCP血清中的4种胆碱类代谢物进行同时定量检测,并对该检测方法进行考察,对定量分析结果进行ROC分析。4.血清中成分复杂,直接检测胆碱类物质N,N二甲基甘氨酸的灵敏度不高,建立和确证了柱前衍生化N,N二甲基甘氨酸的血清专属性检测方法。对来自江西省妇幼保健院的86例CHDP与92例NCP血清中的二甲基甘氨酸进行定量检测及ROC分析,然后用另外30例来自嘉兴市妇幼保健院的CHDP和30例NCP进一步验证。5.整合所有实验数据,通过建立二元Logistic回归模型及DA判别模型,来筛选出较好的血清标志物组合来诊断胎儿先天性心脏病。结果:1.~1HNMR的非靶标代谢组学结果显示全谱胆碱校准归一化的正交偏最小二乘法判别分析(Orthogonal partial least-squares discriminant analysis,OPLS-DA)模型可以将NCP组及CHDP组的建模样品全部正确分类,预测CHDP组的10例样本,8例的分类得分小于0.5,错误分类2例,正确率为80%,10例NCP组的预测样品,有9例分类得分大于0.5,错误分类1例,正确率为90%,全谱胆碱校准归一化的OPLS-DA模型20例未知样品平均预测准确度高达85%。基于全谱归一化的OPLS-DA模型的VIP>1结合独立样本T检验(P<0.05),筛选出缬氨酸、乳酸、苯丙氨酸三种差异代谢物,经代谢通路分析发现主要影响氨基酸类物质的代谢。2.基于UPLC-MS对10种氨基酸类物质进行定量检测,发现CHDP组血清中的蛋氨酸(Met)、精氨酸(Arg)、脯氨酸(Pro)、谷氨酸(Glu)、苯丙氨酸(Phe)、S-腺苷-L-高半胱氨酸(SAH)、甘氨酸(Gly)具有显著性差异(p<0.05),其中CHDP组血清中的Arg、Pro、Phe、SAH、Gly高于NCP组,其血清中的Met、Glu低于NCP组。ROC结果显示:脯氨酸具有较好的鉴别诊断性能,其AUROC为0.815,特异性和敏感性分别为0.850和0.608。为了找到较好的氨基酸类标志物组合来诊断疾病,建立了二元Logistic回归模型,将Arg、Pro、Glu纳入变量,其模型方程为:Y=-3.994-0.449*X1-1.004*X2+7.179*X3,其中X1为精氨酸的浓度,X2为脯氨酸的浓度,X3为谷氨酸的浓度,精氨酸、脯氨酸、谷氨酸的组合AUC为0.9263,敏感性和特异性分别为75.0%和92.1%,分类准确度为84.6%。3.基于UPLC-MS/MS建立了血清中同时检测4种胆碱类物质的检测方法,经方法学考察,其线性、准确度、精密度良好,对104例血清样本(CHDP=55,NCP=49)中的4种胆碱类物质进行定量检测,发现胆碱、肉碱具有显著性差异,且与NCP组相比,CHDP组血清中肉碱的含量升高,胆碱的含量降低。肉碱的诊断性能较好,其ROC曲线下面积为0.752,特异性和敏感性分别为0.860和0.628。4.建立的柱前衍生化的方法对来自江西省妇幼保健院的178例血清中的N,N二甲基甘氨酸进行定量检测(CHDP=86,NCP=92),发现N,N二甲基甘氨酸具有显著性差异,且与NCP组相比,CHDP组血清中N,N二甲基甘氨酸的含量升高,进行ROC分析,发现胆碱类物质中N,N二甲基甘氨酸的诊断效能最好,其ROC曲线下面积为0.763,特异性和敏感性分别为0.758和0.638。为了验证结果的可靠性,随后收集嘉兴市妇幼保健院的60例血清样本进行了验证(CHDP=30,NCP=30),发现CHDP组血清中的N,N二甲基甘氨酸的浓度要高于NCP组,这与文献报道及我们之前的检测结果一致。5.为了找到较好的血清标志物组合来诊断胎儿先天性心脏病,我们整合所有实验数据,对筛选出的代谢物建立了二元Logistic回归模型,将Pro、Glu、NNDI、Carnitine纳入变量,其模型方程为:Y=9.357-1.088*X1+7.263*X2-2.901*X3-2.081*X4,其中X1为脯氨酸的浓度,X2为谷氨酸的浓度,X3为二甲基甘氨酸的浓度,X4为肉碱的浓度。二甲基甘氨酸、脯氨酸、谷氨酸、肉碱的组合AUC为0.949,分类准确度为87.2%,敏感性和特异性分别为82.5%和89.47%。考虑到本研究中样本量较小,某些代谢物的血清浓度不服从正态分布,随后建立了基于Fisher判据的判别模型,经Wilks的Lambda检验,DA模型对CHDP和NCP分类的判別函数如下:Category 1=2.374*XA+14.244*XB+13.723*XC+13.181*XC-36.824Category 2=1.702*XA+21.870*XB+11.046*XC+10.578*XC-29.280其中XA为脯氨酸的浓度,XB为谷氨酸的浓度,XC为二甲基甘氨酸的浓度,XD为肉碱的浓度。判别模型预测CHDP和NCP的分类准确率分别为84.2%和85.0%,平均准确率为84.6%。另外,采用交叉验证的方法验证了模型的预测效果,结果表明,该模型对交叉验证分组的正确率为83.3%,结果与训练集一致,表明该模型准确可靠,可以用于胎儿先天性心脏病的诊断。结论:本研究发现胎儿CHD孕妇血清中氨基酸、胆碱代谢改变明显,血清中以脯氨酸、谷氨酸、二甲基甘氨酸、肉碱建立的二元Logistic回归模型及DA判别模型区分CHDP组与NCP组的准确度较好,可为临床胎儿CHD的产前诊断提供参考。