论文部分内容阅读
研究背景及目的巨大儿(macrosomia,MA)是产科常见的胎儿并发症之一,在我国的发生率约为7%。巨大儿不仅导致胎儿肩难产、臂丛神经损伤、产妇产后出血等短期不良妊娠结局,还与子代肥胖、糖尿病、哮喘、心血管疾病等远期并发症有关。与此同时,阴道助产率和剖宫产率也随之增高。因此,早期预测有助于改善妊娠期管理,及时在围产期采取针对性措施。尽管巨大儿发生率几年来持续增加,但是目前仍然没有可靠的早期预测方法。1966年,Tan在狼疮患者血浆中发现游离DNA(cell-free DNA,cfDNA)存在,1997年,Dennis Lo团队首先发现母体血浆中存在胎儿游离DNA(cell-free fetal DNA,cffDNA)。孕妇血浆cfDNA主要由10~15%来自胎盘滋养细胞的cffDNA和85~90%来自母体髓系/淋巴系细胞的cflDNA组成。研究表明cfDNA是核小体上与蛋白质结合的DNA片段,因此在细胞凋亡时不会被酶消化而进入循环。并且核小体在转录起始位点(transcription start sites,TSS)附近具有鲜明的分布特点,其分布特点可以反映基因的表达水平。本研究采用二代测序技术及生物信息分析技术,基于母体血浆cfDNA测序,进行核小体足迹分析,建立一种无创的产前巨大儿预测分类器,以实现在妊娠早期预测巨大儿,加强妊娠期管理和降低剖宫产率。方法本研究对象为2018年1月至2019年1月分别在南方医科大学南方医院、中山大学附属第三医院和河北省沧州市人民医院产前诊断中心就诊的早孕期及中孕期(12+0~27+6周)单胎妊娠孕妇,对符合入组条件的孕妇进行NIPT数据分析。选取47例分娩巨大的孕妇和47例采血孕周相同的分娩健康新生儿的孕妇,对样本进行低深度全基因组测序,比较两组的数据在初始转录起始位点(primary transcription start sites,pTSS)核小体足迹差异。采用威尔科克森符号秩检验(Wilcoxon Signed-Rank Test)计算P值,再使用 Benjamini-Hochberg 方法对 P值进行校正,计算伪发现率(FDR)。设置条件为FDR<0.05,且fold change≥1.3,筛选出在pTSS核小体足迹存在差异的基因。采用Logistic回归模型和逐步回归特征选法选择差异表达基因构建预测分类器,然后采用交叉验证法对分类器的鲁棒性进行评估。采用接受者操作特性曲线(ROC曲线)进行分类器有效性的检验,包括曲线下面积(AUC)、准确率、敏感性和特异性。选择曲AUC值最大的分类器作为最佳分类器。使用四个独立的队列,包括一个内部验证队列、两个外部验证队列和一个所有受试者队列,对上一步获得的最佳分类器进行验证。计算分类器在每个队列中的效能,包括AUC、准确率、敏感性和特异性。结果本次研究共纳入810例孕妇,其中具有完整孕期检查结果符合纳入条件的分娩巨大儿的孕妇162例(巨大儿组,n=162),通过采血孕周与巨大儿组相匹配以1:4的比例纳入分娩健康新生儿的孕妇648例(对照组,n=648)。由94例孕妇组成的队列共筛选出1086个在pTSS核小体足迹存在差异的基因,其中上调表达基因575个,下调表达基因511个。对所有差异基因进行特征选择,最终筛选出 12 个基因(SMC3,MASTL,CREM,C1QTNF12,MLXIP,MAP3K9,IGSF6,APC2,GPM6A,TMEM128,NIPBL,TMEM184A)组成的分类器(CMA-A)分类效果最好,准确率80.0%,AUC等于0.766,95%CI(0.678-0.854)。四个验证队列中,内部验证队列的准确率为84.6%,AUC等于0.817,95%CI(0.689-0.945);外部验证队列-1的准确率为80.5%,AUC等于0.791,95%CI(0.721-0.861);外部验证队列-2的准确率为78.8%,敏感性71.9%,特异性80.5%,AUC等于0.762,95%CI(0.675-0.848);所有受试者队列的准确率为80.3%,AUC等于0.779,95%CI(0.736-0.823)。结论本研究证实,基于分析孕妇血浆cfDNA核小体足迹差异,可以构建具有妊娠早期预测巨大儿价值的分类器,有助于加强孕期管理以及选择合适的分娩方式。低深度的全基因组测序可以使用常规的NIPT数据,无需额外检测,具有广阔的临床应用前景。