论文部分内容阅读
精神分裂症被定义为一种关于症状、病程和结局的异质性临床综合征,与其他社会心理障碍具有共同的表现,诊断界限不明确,缺乏客观的生物学诊断指标,从而导致对其诊断不够准确而且难度较大。精神分裂症患者往往需要终身治疗,但早期诊断、早期治疗可能在严重并发症发生之前有效控制相关临床症状,并有助于改善其长期预后。目前使用生物标志物诊断和预测精神疾病的治疗反应仍是一个挑战,探索能够为早期诊断、鉴别诊断提供客观证据的新型生物学标志物就显得非常迫切,敏感、特异的生物标志物不仅有助于疾病的早期识别与鉴别诊断,而且也是精准个性化治疗的前提;有效的新型生物标志物不仅可以提高疾病诊断的生物学同质性,同时为新药物的开发提供支持,但仍需进一步开展高质量系列研究。目的:本研究拟获得精神分裂症患者外周血特异差异表达基因,同时识别出疾病相关的关键共表达模块及模块内的关键基因,从多基因相互作用的角度挖掘精神分裂症的发病机制;初步构建精神分裂症血液免疫细胞水平全景图,探讨血液免疫细胞与精神分裂症之间的关联性;对联合关键基因和免疫细胞亚群的精神分裂症血液诊断模型的建立进行初步探索并对关键基因进行人群验证,为寻找精神分裂症血液新型诊断生物标志物、发现潜在药物治疗靶点提供理论依据。方法:1.基于15例首发无用药史SCZ患者和15例健康对照的血液RNA-seq数据,采用三种差异基因分析方法(limma、DESeq2和edgeR)分别进行差异分析并取交集,筛选出精神分裂症患者血液可靠差异表达基因(DEGs),并对其进行GO/KEGG通路及GSEA分析,探讨DEGs的生物学功能;构建PPI互作网络关系筛选关键差异基因。2.采用WGCNA方法构建加权基因共表达网络并识别共表达基因模块,采用内部和外部数据集进行模块保守性验证;通过模块-性状关联性研究,寻找与SCZ相关的关键模块及模块内的Hub基因,并分别对其进行GO/KEGG通路分析,识别其生物学功能及意义;采用WGCNA方法分别对SCZ和CTL血液样本基因表达谱数据构建基因共表达网络,然后基于基因共存在分析和拓扑结构改变两个方面,识别出SCZ特异共表达模块并对其生物学功能进行探讨。3.采用系统评价和Meta分析方法,通过计算机检索Medline(PubMed)、Embase、Web of Science、Cochrane Library、CNKI、万方数据库收集已发表的有关血液免疫细胞水平与SCZ关联性研究的中英文文献,检索时间截止到2021年11月。按照预先制定好的纳入、排除标准筛选文献,对纳入文献进行质量评价,提取数据进行合并。然后采用CIBERSORT和xCell算法基于血液基因表达谱数据定量估计免疫细胞亚群水平,并对其进行相关性分析。4.基于GEO数据库,通过对3种主要精神疾病(SCZ,BPD,MDD)血液基因表达谱数据进行差异分析,筛选出在SCZ中显著差异表达,而在BPD和MDD中均不显著表达的血液特异差异表达基因;将其与我们测序数据获得的DEGs和关键模块基因取交集,获得SCZ血液特异性关键基因。然后,利用JASPAR数据库来预测与关键基因相互作用的转录因子,并通过Tarbase v8.0和Mitarbase v8.0数据库来预测与之相互作用的miRNAs,并通过RegNetwork数据库来构建TFs-Genes-miRNAs共调控网络。利用CTD数据库和DSigDB数据库分别预测与关键基因相互作用的小分子化学物和药物,并通过Cytoscape软件对相应调控网络进行可视化。最后,采用病例对照研究设计,通过RT-qPCR方法对筛选出的关键基因进行人群验证。5.以我们的RNA-seq数据作为训练集,联合验证关键基因和淋巴细胞比例等特征,使用三种成熟的机器学习算法(RF:随机森林;SVM:支持向量机;DT:决策树)通过10次重复3折CV分别构建疾病诊断模型,并将10次试验结果的平均值作为最终的性能结果,以最优模型作为最终诊断模型,并对其诊断性能进行外部数据集验证,评估这些血液生物标志物的诊断价值。结果:1.三种差异基因分析结果之间具有高度相关性,共鉴定出225个可靠DEGs,其中105个上调基因,120个下调基因;而RPS27A是中心性分析中排名第一的差异基因。GSEA分析结果显示,上调差异表达基因主要参与内质网中的蛋白质加工、志贺氏菌病和Epstein-Barr病毒感染;下调差异表达基因主要涉及阿尔茨海默病、COVID-19、亨廷顿病、肌萎缩性侧索硬化症、帕金森病、核糖体和多种神经退行性疾病等相关通路。2.WGCNA网络共识别出28个基因共表达模块并且经内部和外部数据集验证显示,模块具有可重复性;通过模块-性状关联分析得到4个与SCZ显著相关共表达模块,tan模块与SCZ呈负相关,turquoise、lightcyan和orange模块基因与SCZ呈正相关,将4个共表达模块基因合并为WGCNAMEs(2835个基因)。通过对疾病性状相关的基因显著性(GS)与各模块中基因MM值进行相关性分析,发现tan模块与MM的相关系数最高,依次为orange、turquoise模块,而lightcyan模块无相关性;按照|MM|>0.8&|GS|>0.2关键基因筛选标准,共鉴定出468个关键基因,其中tan模块33个,orange模块16个,turquoise模块419个,这些关键基因主要富集于与翻译起始、核转录mRNA分解代谢过程、病毒基因表达、核糖体、COVID-19,多种癌症,铂耐药性,PI3K-Akt信号通路,EGFR酪氨酸激酶抑制剂耐药性,JAK-STAT信号通路等相关通路。基于共存在基因分析识别出lightcyan、grey60和lightyellow模块是SCZ的特异共表达模块,基于拓扑结构改变识别出darkred和white模块也是其特异共表达模块。3.血液免疫细胞水平与SCZ关联性研究的Meta分析结果显示,与对照组相比,SCZ患者血液CD19淋巴细胞、单核细胞和中性粒细胞计数,CD4和CD56淋巴细胞百分比,CD4/CD8比值,中性粒细胞/淋巴细胞比值(NLR),单核细胞/淋巴细胞比值(MLR)均显著增加(P<0.05)。首发患者血液CD3、CD4淋巴细胞和中性粒细胞计数,CD4/CD8淋巴细胞比值,单核细胞/淋巴细胞比值(MLR)较健康对照组均显著增加(P<0.05)。在敏感性分析中,异质性及合并结果均无显著性改变;研究间无发表性偏倚。4.CIBERSORT结果显示,与正常样本相比,SCZ患者血液中含有更多的淋巴细胞和单核细胞,以及相对较少的中性粒细胞、静止的肥大细胞和激活的NK细胞;xCELL结果显示SCZ患者血液多种免疫细胞显著上调,不同细胞亚型表现出不同的变化趋势,T淋巴细胞占主导地位,表明免疫细胞参与了 SCZ的发生发展。5.基于GSE38485获得823个SCZ差异表达基因,GSE124326获得1355个BPD差异表达基因,GSE32280筛选出192个MDD差异表达基因,最终筛选出772个SCZ血液特异性差异基因;然后,将其与我们RNA-seq数据获得的可靠DEGs和WGCNAMEs取交集,获得12个SCZ血液特异性关键基因(KRT1,SNRPG,TMEM14B,TOMM7,AQP10,CLEC12A,LSM3,RPL17,RPL26,RPL9,RPS24和 TRAT1)。6.利用JASPAR数据库来预测与关键基因相互作用的TFs,共包括了 56个点和89条边,主要转录因子分别是FOXC1、GATA2、GATA3、FOXL1、E2F1。利用Tarbase v8.0和MiRTarBase v8.0数据库来预测与关键基因相互作用的miRNAs,共包括31个点和53条边,主要miRNAs分别是miR-1-3p、miR-27a-3p、miR-126-3p、miR-155-5p、miR-20a-5p。利用 CTD 数据库预测排名前 5 的化学物依次为丙戊酸、三氧化二砷、肼苯哒嗪、氯化苦、酶抑制剂;利用DSigDB数据库预测排名前5的药物依次为肼苯哒嗪、尿素、甘油、偏苯三酸酐、艾芬地尔。7.人群RT-qPCR验证结果显示,共8个genes(SNRPG,AQP10,CLEC12A,TOMM7,TMEM14B,RPL9,RPL26,RPS24)组间差异有统计学意义;除TMEM14B外,其他7个genes变化趋势与测序结果均一致。8.以我们的测序数据为训练集,联合患者年龄、性别,7个验证关键基因和3种免疫细胞比例(淋巴细胞、单核细胞、中性粒细胞)构建诊断模型,结果显示 RF 分类器模型性能最佳(AUROC:RF,0.855;SVM,0.795;DT,0.845),可以准确地对两组进行分类;基于RF的Gini系数变量重要性排序结果表明,TOMM7是最重要的特征变量,在免疫细胞比例中,单核细胞的变量重要性最高。对性能最佳的RF分类器模型进行外部数据集验证显示,外部SCZ队列的AUROC 为 0.820;BPD 队列的 AUROC 为 0.586。结论:1.本研究鉴定出SCZ患者血液225个可靠差异表达基因,其中105个上调基因和120个下调基因;TOP 20的差异表达基因主要作为核糖体蛋白(RPs)基因、干扰素刺激基因、炎症和免疫反应调控基因;差异基因主要富集于核糖体、免疫系统、病毒感染和神经退行性变疾病等相关功能及通路。2.本研究使用WGCNA方法所构建的基因共表达网络稳健可靠,鉴定出4个与SCZ显著相关的共表达模块(tan、turquoise、lightcyan和orange模块);5 个 SCZ 血液特异共表达模块(lightcyan、grey60、lightyellow、darkred 和 white模块)。3.首次利用SCZ血液RNA-seq数据基于CIBERSORT和xCELL算法初步构建了 SCZ血液免疫细胞水平全景图,血液淋巴细胞、单核细胞和中性粒细胞可能与疾病的发生、病理生理学相关,有可能作为SCZ的新的血液诊断生物标志物。4.本研究确定了SCZ的几种潜在血液生物标记物,包括7个特异性关键基因(SNRPG,AQP10,CLEC12A,TOMM7,RPL9,RPL26,RPS24)和 3 种主要外周免疫细胞(淋巴细胞,单核细胞和中性粒细胞),以增强对外周免疫细胞异质性和复杂性的认识,为SCZ患者提供有希望的治疗靶点。RF算法分类器模型诊断性能最佳且在外部SCZ队列中取得了良好的表现(AUROC,0.82),但在外部BPD队列中AUROC较低(0.58)。本研究发现的生物标志物有望作为SCZ早期诊断和治疗的潜在血液生物标志物,但仍需进一步的实验研究。