论文部分内容阅读
目的:运用基因表达芯片数据库采用生物信息学方法筛选影响非吸烟COPD患者和吸烟COPD患者的差异表达基因,确定m6ARNA甲基化调节因子在非吸烟COPD和吸烟COPD患者中的表达和潜在功能。方法:通过GEO数据库下载非吸烟COPD患者和正常人的小气道上皮细胞甲基化测序数据集GSE162154、GSE137557,吸烟COPD患者和正常人小气道上皮细胞甲基化测序数据集GSE122957、GSE123129。利用R语言数据包对样本进行表达差异基因的分析,差异表达基因进行了Venn图可视化展示。利用R语言(R4.0)的Cluster Profiler软件包对差异基因进行基因功能注释GO分析和KEGG通路分析。利用Stats软件包(v4.2)对这些共有的差异表达基因进行相关性分析,并选取p值小于0.05、r(相关性系数)>0.7的基因对进行相关性网络构建。随后利用Cytoscape软件的Cytohubba插件计算网络节点得分,选取得分前20的节点作为网络Hub基因,并根据这20个基因绘制网络结构图。搜寻被广泛认可的16种甲基化调节因子。利用Strings在线网站对网络关键基因和调控因子进行PPI蛋白互作网络分析。在R环境下用Pheatmap软件包(v1.0.12)进行了聚类热图绘制,分析相关性。在R语言环境下利用Ggplot2(version3.3.5)软件包作分析不同调控因子在COPD患者和正常人体内表达量小提琴图,p<0.05被认为是在比较组和对照组之间有显著差异。在R中使用Plot ROC(version 2.2.1)分析显示基因在不同分组中的权重,基因的AUC值越大(0.5-1),表明基因对不同比较组的区分越明显。结果:1.通过GEO数据库检索,获取非吸烟者COPD患者和正常人数据集:GSE162154、GSE137557。吸烟者COPD和正常人测序数据集GSE122957、GSE123129。GSE162154数据集和GSE137557数据集中存在287个共有差异基因。GSE122957数据集和GSE123129数据集中存在181个共有差异基因。2.这些差异基因参与不同的生物学过程。非吸烟COPD患者中,在生物过程通路中,差异基因主要富集在肽基赖氨酸修饰;在细胞组成中,差异基因主要富集在核包膜;在分子功能通路中,差异基因主要富集在转录核心调节器作用力。KEGG通路中差异表达基因主要富集在人乳头瘤病毒感染中。吸烟COPD患者中,差异基因主要富集在细胞运输;在细胞组成通路中,差异基因主要富集在早期内质体;在分子功能通路中,差异基因主要富集在肽抗原结合能力;KEGG通路中差异表达基因主要富集在细胞粘附分子。3.共有差异基因相关性网络分析和网络关键基因中,非吸烟组COPD组中287个共有的差异表达基因中,PROSER1,WDR6,NEK6,VRK3等20个基因的得分最高。在吸烟COPD组181个共有的差异表达基因中,MED14,B4GALT3,SNX6,SPRYD7等前20个基因的得分最高。4.在关键基因和调节因子的PPI网络分析中,非吸烟COPD组中以ZC3H13、METTL14为中心,吸烟COPD组中则是以FTO占据网络核心位置。5.Hub基因与m6A甲基化调节因子之间的聚类热图分析,非吸烟COPD患者和吸烟COPD患者中,大部分m6A甲基化调节因子与Hub基因均有一定关联性。6.GSE162154数据集中ZC3H13调控因子在患者体内表达量显著高于正常水平,其他调节因子表达量在患者和正常对象体内无差异。GSE137557数据集中则有ZC3H13,ALKBH5,YTHDF2和WTAP四种调控因子在患者体内表达量显著高于正常水平。GSE122957中不同调节因子在吸烟COPD和正常对象体内的表达情况基本无差异。GSE123129中只有YTHDF2和FTO在吸烟COPD和正常对象体内的表达情况有显著差异。7.调节因子的ROC分析中,GSE162154数据的YTHDC1的AUC值最大,表明YTHDC1对于非吸烟CPDD患者和正常人的区分度最为明显。而在GSE137557数据集中,METTL14的AUC值最大,表明METTL14对于非吸烟CPDD患者和正常人的区分度最为明显。在GSE122957数据集和GSE123129数据集中,均为IGF2BP3的AUC值最高,表明IGF2BP3对于吸烟COPD患者和正常人的区分度最为明显。结论:通过生物信息学方法分析得到在非吸烟COPD患者中m6A RNA调节因子ZC3H13、YTHDC1和METTL14的表达与某些有显著的相关性关键基因促进COPD发展进程的信号通路和生物学过程及COPD的发生密切相关。而在吸烟COPD患者中则是与YTHDF2和FTO以及IGF2BP3的表达密切相关。这些调节因子有望成为确诊COPD患者的生物标志物及干预治疗的靶点。