基于血液基因表达谱的精神分裂症诊断模型的构建及关键基因验证

来源 :吉林大学 | 被引量 : 0次 | 上传用户:peterwei2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
精神分裂症被定义为一种关于症状、病程和结局的异质性临床综合征,与其他社会心理障碍具有共同的表现,诊断界限不明确,缺乏客观的生物学诊断指标,从而导致对其诊断不够准确而且难度较大。精神分裂症患者往往需要终身治疗,但早期诊断、早期治疗可能在严重并发症发生之前有效控制相关临床症状,并有助于改善其长期预后。目前使用生物标志物诊断和预测精神疾病的治疗反应仍是一个挑战,探索能够为早期诊断、鉴别诊断提供客观证据的新型生物学标志物就显得非常迫切,敏感、特异的生物标志物不仅有助于疾病的早期识别与鉴别诊断,而且也是精准个性化治疗的前提;有效的新型生物标志物不仅可以提高疾病诊断的生物学同质性,同时为新药物的开发提供支持,但仍需进一步开展高质量系列研究。目的:本研究拟获得精神分裂症患者外周血特异差异表达基因,同时识别出疾病相关的关键共表达模块及模块内的关键基因,从多基因相互作用的角度挖掘精神分裂症的发病机制;初步构建精神分裂症血液免疫细胞水平全景图,探讨血液免疫细胞与精神分裂症之间的关联性;对联合关键基因和免疫细胞亚群的精神分裂症血液诊断模型的建立进行初步探索并对关键基因进行人群验证,为寻找精神分裂症血液新型诊断生物标志物、发现潜在药物治疗靶点提供理论依据。方法:1.基于15例首发无用药史SCZ患者和15例健康对照的血液RNA-seq数据,采用三种差异基因分析方法(limma、DESeq2和edgeR)分别进行差异分析并取交集,筛选出精神分裂症患者血液可靠差异表达基因(DEGs),并对其进行GO/KEGG通路及GSEA分析,探讨DEGs的生物学功能;构建PPI互作网络关系筛选关键差异基因。2.采用WGCNA方法构建加权基因共表达网络并识别共表达基因模块,采用内部和外部数据集进行模块保守性验证;通过模块-性状关联性研究,寻找与SCZ相关的关键模块及模块内的Hub基因,并分别对其进行GO/KEGG通路分析,识别其生物学功能及意义;采用WGCNA方法分别对SCZ和CTL血液样本基因表达谱数据构建基因共表达网络,然后基于基因共存在分析和拓扑结构改变两个方面,识别出SCZ特异共表达模块并对其生物学功能进行探讨。3.采用系统评价和Meta分析方法,通过计算机检索Medline(PubMed)、Embase、Web of Science、Cochrane Library、CNKI、万方数据库收集已发表的有关血液免疫细胞水平与SCZ关联性研究的中英文文献,检索时间截止到2021年11月。按照预先制定好的纳入、排除标准筛选文献,对纳入文献进行质量评价,提取数据进行合并。然后采用CIBERSORT和xCell算法基于血液基因表达谱数据定量估计免疫细胞亚群水平,并对其进行相关性分析。4.基于GEO数据库,通过对3种主要精神疾病(SCZ,BPD,MDD)血液基因表达谱数据进行差异分析,筛选出在SCZ中显著差异表达,而在BPD和MDD中均不显著表达的血液特异差异表达基因;将其与我们测序数据获得的DEGs和关键模块基因取交集,获得SCZ血液特异性关键基因。然后,利用JASPAR数据库来预测与关键基因相互作用的转录因子,并通过Tarbase v8.0和Mitarbase v8.0数据库来预测与之相互作用的miRNAs,并通过RegNetwork数据库来构建TFs-Genes-miRNAs共调控网络。利用CTD数据库和DSigDB数据库分别预测与关键基因相互作用的小分子化学物和药物,并通过Cytoscape软件对相应调控网络进行可视化。最后,采用病例对照研究设计,通过RT-qPCR方法对筛选出的关键基因进行人群验证。5.以我们的RNA-seq数据作为训练集,联合验证关键基因和淋巴细胞比例等特征,使用三种成熟的机器学习算法(RF:随机森林;SVM:支持向量机;DT:决策树)通过10次重复3折CV分别构建疾病诊断模型,并将10次试验结果的平均值作为最终的性能结果,以最优模型作为最终诊断模型,并对其诊断性能进行外部数据集验证,评估这些血液生物标志物的诊断价值。结果:1.三种差异基因分析结果之间具有高度相关性,共鉴定出225个可靠DEGs,其中105个上调基因,120个下调基因;而RPS27A是中心性分析中排名第一的差异基因。GSEA分析结果显示,上调差异表达基因主要参与内质网中的蛋白质加工、志贺氏菌病和Epstein-Barr病毒感染;下调差异表达基因主要涉及阿尔茨海默病、COVID-19、亨廷顿病、肌萎缩性侧索硬化症、帕金森病、核糖体和多种神经退行性疾病等相关通路。2.WGCNA网络共识别出28个基因共表达模块并且经内部和外部数据集验证显示,模块具有可重复性;通过模块-性状关联分析得到4个与SCZ显著相关共表达模块,tan模块与SCZ呈负相关,turquoise、lightcyan和orange模块基因与SCZ呈正相关,将4个共表达模块基因合并为WGCNAMEs(2835个基因)。通过对疾病性状相关的基因显著性(GS)与各模块中基因MM值进行相关性分析,发现tan模块与MM的相关系数最高,依次为orange、turquoise模块,而lightcyan模块无相关性;按照|MM|>0.8&|GS|>0.2关键基因筛选标准,共鉴定出468个关键基因,其中tan模块33个,orange模块16个,turquoise模块419个,这些关键基因主要富集于与翻译起始、核转录mRNA分解代谢过程、病毒基因表达、核糖体、COVID-19,多种癌症,铂耐药性,PI3K-Akt信号通路,EGFR酪氨酸激酶抑制剂耐药性,JAK-STAT信号通路等相关通路。基于共存在基因分析识别出lightcyan、grey60和lightyellow模块是SCZ的特异共表达模块,基于拓扑结构改变识别出darkred和white模块也是其特异共表达模块。3.血液免疫细胞水平与SCZ关联性研究的Meta分析结果显示,与对照组相比,SCZ患者血液CD19淋巴细胞、单核细胞和中性粒细胞计数,CD4和CD56淋巴细胞百分比,CD4/CD8比值,中性粒细胞/淋巴细胞比值(NLR),单核细胞/淋巴细胞比值(MLR)均显著增加(P<0.05)。首发患者血液CD3、CD4淋巴细胞和中性粒细胞计数,CD4/CD8淋巴细胞比值,单核细胞/淋巴细胞比值(MLR)较健康对照组均显著增加(P<0.05)。在敏感性分析中,异质性及合并结果均无显著性改变;研究间无发表性偏倚。4.CIBERSORT结果显示,与正常样本相比,SCZ患者血液中含有更多的淋巴细胞和单核细胞,以及相对较少的中性粒细胞、静止的肥大细胞和激活的NK细胞;xCELL结果显示SCZ患者血液多种免疫细胞显著上调,不同细胞亚型表现出不同的变化趋势,T淋巴细胞占主导地位,表明免疫细胞参与了 SCZ的发生发展。5.基于GSE38485获得823个SCZ差异表达基因,GSE124326获得1355个BPD差异表达基因,GSE32280筛选出192个MDD差异表达基因,最终筛选出772个SCZ血液特异性差异基因;然后,将其与我们RNA-seq数据获得的可靠DEGs和WGCNAMEs取交集,获得12个SCZ血液特异性关键基因(KRT1,SNRPG,TMEM14B,TOMM7,AQP10,CLEC12A,LSM3,RPL17,RPL26,RPL9,RPS24和 TRAT1)。6.利用JASPAR数据库来预测与关键基因相互作用的TFs,共包括了 56个点和89条边,主要转录因子分别是FOXC1、GATA2、GATA3、FOXL1、E2F1。利用Tarbase v8.0和MiRTarBase v8.0数据库来预测与关键基因相互作用的miRNAs,共包括31个点和53条边,主要miRNAs分别是miR-1-3p、miR-27a-3p、miR-126-3p、miR-155-5p、miR-20a-5p。利用 CTD 数据库预测排名前 5 的化学物依次为丙戊酸、三氧化二砷、肼苯哒嗪、氯化苦、酶抑制剂;利用DSigDB数据库预测排名前5的药物依次为肼苯哒嗪、尿素、甘油、偏苯三酸酐、艾芬地尔。7.人群RT-qPCR验证结果显示,共8个genes(SNRPG,AQP10,CLEC12A,TOMM7,TMEM14B,RPL9,RPL26,RPS24)组间差异有统计学意义;除TMEM14B外,其他7个genes变化趋势与测序结果均一致。8.以我们的测序数据为训练集,联合患者年龄、性别,7个验证关键基因和3种免疫细胞比例(淋巴细胞、单核细胞、中性粒细胞)构建诊断模型,结果显示 RF 分类器模型性能最佳(AUROC:RF,0.855;SVM,0.795;DT,0.845),可以准确地对两组进行分类;基于RF的Gini系数变量重要性排序结果表明,TOMM7是最重要的特征变量,在免疫细胞比例中,单核细胞的变量重要性最高。对性能最佳的RF分类器模型进行外部数据集验证显示,外部SCZ队列的AUROC 为 0.820;BPD 队列的 AUROC 为 0.586。结论:1.本研究鉴定出SCZ患者血液225个可靠差异表达基因,其中105个上调基因和120个下调基因;TOP 20的差异表达基因主要作为核糖体蛋白(RPs)基因、干扰素刺激基因、炎症和免疫反应调控基因;差异基因主要富集于核糖体、免疫系统、病毒感染和神经退行性变疾病等相关功能及通路。2.本研究使用WGCNA方法所构建的基因共表达网络稳健可靠,鉴定出4个与SCZ显著相关的共表达模块(tan、turquoise、lightcyan和orange模块);5 个 SCZ 血液特异共表达模块(lightcyan、grey60、lightyellow、darkred 和 white模块)。3.首次利用SCZ血液RNA-seq数据基于CIBERSORT和xCELL算法初步构建了 SCZ血液免疫细胞水平全景图,血液淋巴细胞、单核细胞和中性粒细胞可能与疾病的发生、病理生理学相关,有可能作为SCZ的新的血液诊断生物标志物。4.本研究确定了SCZ的几种潜在血液生物标记物,包括7个特异性关键基因(SNRPG,AQP10,CLEC12A,TOMM7,RPL9,RPL26,RPS24)和 3 种主要外周免疫细胞(淋巴细胞,单核细胞和中性粒细胞),以增强对外周免疫细胞异质性和复杂性的认识,为SCZ患者提供有希望的治疗靶点。RF算法分类器模型诊断性能最佳且在外部SCZ队列中取得了良好的表现(AUROC,0.82),但在外部BPD队列中AUROC较低(0.58)。本研究发现的生物标志物有望作为SCZ早期诊断和治疗的潜在血液生物标志物,但仍需进一步的实验研究。
其他文献
锂金属电池因其极低的氧化还原电位、超高的理论能量密度而成为当前国际研究前沿与热点。然而,锂枝晶不可控生长导致的循环稳定性差、安全性低等问题严重制约了锂金属电池商业化进程。针对锂金属电池的这些问题,本论文以低成本过渡族金属氮化物为研究对象,分别在隔膜表面、锂金属负极表面及三维骨架上设计、构筑亲锂的金属氮化物纳米功能材料,系统研究其对锂枝晶生长与电化学性能的影响规律,理论计算结合实验表征分析揭示了其电
计算机视觉作为新一代人工智能的重要领域,它的蓬勃发展会对国计民生产生重大的积极作用。计算机视觉领域的核心要务是效仿人类视觉系统让计算机理解数字图像或视频中的视觉内容。当下计算机视觉领域中一些视觉认知任务已经取得了长足的进步,诸如图像识别和实例检测等任务。然而孤立地识别和检测实例并不能充分地理解图像中的场景内容,实例与实例之间丰富的关系对理解图像的场景内容也至关重要。因此本文关注于如何探索视觉信号中
功能梯度磁电弹材料作为一种新型复合智能材料,兼具压电材料与压磁材料的优良特性,且材料属性沿空间某方向呈梯度连续变化,内部界面不明显,优化了材料内部的应力分布,具有传统层状复合材料无法比拟的力学性能。功能梯度磁电弹材料最大限度地降低了不同材料之间的性能差异,且其具有优良的多物理场耦合效应,因此,该材料在信息技术、航空航天技术、微机电技术等高新尖技术领域得到了广泛的应用。为进一步发挥功能梯度磁电弹材料
非辐射电磁源最早是在量子力学和天体物理学中被提出来的,然而由于缺乏合适的研究体系,在很长一段时间内它在光子学领域并没有得到太多的关注。随着近二十年来超构光子学的快速发展,超材料和超表面表现出对电磁波强大的调控能力,同时得益于相关理论的提出,人们逐渐发现具有非辐射特性的光学模式在捕获入射光、增强局域电场强度、调控远场散射以及调控微纳米尺度的非线性效应等方面具有非常大的潜力。超表面,特别是具有增强光与
氢能源是未来发展的重要方向之一,电解水制氢是最清洁、最可持续的制氢方式。目前,电解水制氢最有效的电催化剂仍是贵金属基催化剂,而贵金属价格昂贵,储量有限,因此不利于大规模应用。相比之下,非贵金属电催化剂价格低廉、资源丰富且环境友好,有望成为贵金属材料潜在的替代者,实现电解水制氢的大规模工业生产。然而,非贵金属电催化剂的活性不高,因此高效非贵金属电催化剂的设计研究,仍是一项颇具挑战性的工作。本论文通过
金纳米粒子(AuNPs)在化学、生物传感、催化、光电子学、治疗学和诊断学等领域展现出广泛的应用前景。AuNPs的光学、电子和催化特性以及胶体稳定性都受到AuNPs表面配体的影响。聚合物配体不仅可以在不同溶剂中的稳定AuNPs,还可以调控AuNPs的刺激响应自组装和表面图案化,降低AuNPs在血液中的蛋白质吸附,提高AuNPs的生物相容性、血液循环时间和肿瘤递送效率。常见的聚合物通过巯基基团与金表面
自Brookhart在1995年发现了阳离子的α-二亚胺钯和镍催化剂后,后过渡金属催化的烯烃聚合与共聚合受到了越来越多的关注。此后,研究人员发展了大量基于后过渡金属的催化剂和聚合方法,其中有很多性能优异的催化体系,如α-二亚胺钯/镍体系、水杨醛亚胺镍体系、膦磺酸钯/镍体系和膦酚镍体系等。然而,现有的钯/镍催化剂仍然存在一些问题,比如活性低、热稳定性差、制备的聚合物分子量低以及共聚单体插入率低等。这
新兴通信技术以及超大规模集成电路线路板正朝高频、高速方向发展,对基板、层间和模组件低介电材料提出越来越高的要求。然而,传统线路板金属图案化和树脂固化成型配套工艺较为复杂,同时随着特殊应用领域以及异形器件的发展,低介电载板和层间介质也越来越需要具备异形化定制能力。因此,具有可光固化性能的低介电树脂与光刻、3D打印技术相兼容从而实现低介电和图案化集成。基于此,本论文以单/双硅杂环丁烷和苯并环丁烯(BC
激光冲击强化技术通过对材料表层进行高压力、超快速、非接触的激光精准加工,从而调控材料表层残余应力分布、诱导表层梯度微观组织结构,进而实现材料疲劳性能的显著提高,在未来航空抗疲劳制造领域应用前景广阔。然而,目前对于激光冲击诱导金属材料表层微观组织特征及梯度结构的形成仍缺乏深入的理解、复杂工程结构表面残余应力调控技术仍缺乏充分的研究、激光冲击诱导表层残余应力分布与疲劳性能的内在关联仍不十分明晰。本文采
爱库存作为库存电商新生市场中的开拓者和独角兽企业,虽然拥有先行者优势,但其存在商业模式易被模仿、私域流量渠道难以管控等问题,制约了企业发展。因此,本文首先通过对爱库存公司渠道运营现状进行分析,发现其在运营中暴露出的薄弱环节和关键问题,如品牌宣传力度不足、渠道管理混乱、渠道规模发展缓慢等。其次,通过德尔菲法和层次分析法,建立库存电商渠道评价体系,用以分析影响库存电商渠道增长的关键因素,如传播能力、销