论文部分内容阅读
肥胖一种由环境因素和遗传因素共同作用导致的慢性代谢性疾病。世界范围内肥胖的患病率和发病率持续增长,越来越多的人深受肥胖及其并发症的困扰。人群基因组学及脂肪细胞的转录组学研究在揭示肥胖症候选易感基因方面起到了巨大的作用。然而,传统分析方法以关注单个基因或单个DNA变异位点的效应为核心,这使它在揭示基因复杂互作关系在多基因疾病发病中的作用方面无法避免地出现“盲区”。本研究结合现有的蛋白质互作(PPI)知识,对肥胖症相关的一个全基因组关联研究和三组转录组学研究数据进行了进一步的分析和挖掘,以期从蛋白互作网络的角度鉴定一批新的在脂肪细胞分化过程及肥胖症中可能起重要作用的基因及蛋白相互作用模块。本研究主要分两个部分:①对公共数据库的三个成脂分化基因表达谱研究数据集进行了Meta分析及蛋白质-蛋白质相互作用(PPI)网络分析;②对本课题组参与的一个中国人群肥胖全基因组关联研究(GWAS)数据进行了基因水平的GWAS研究及PPI网络分析。首先我们对三组相似研究设计的人源脂肪细胞分化转录组学研究(GSE28628、 GSE37836、GSE39342)进行了Meta分析,以获得稳定可信的成脂分化差异表达基因(DEG)。通过Meta分析,我们获得Meta P<0.01且至少在两个单独的研究中满足差异表达倍数≥2或≤0.5、且P<0.05的成脂分化早期DEGs1505个(最显著的基因为HNT, Meta P=1.41×10-14),成脂分化晚期DEGs304个(最显著的基因为LETMD1, Meta P=1.65×10-11)。分别对这些成脂分化早期、晚期DEGs构建蛋白互作网络图,我们发现这些基因处在紧密的互作之中,分化早期DEGs构成的最大互作子网络由699个基因组成,包含7个统计学显著的基因模块(P<0.05);分化晚期的最大互作子网络由51个基因组成,包含6个统计学显著的基因模块(P<0.05)。网络拓扑结构的分析揭示了一系列可能在成脂分化过程中起重要作用的网络枢纽基因,如分化早期DEG互作网络中的枢纽基因CDK2(连通度=95,介数=9177.05),HDACl (连通度=62,介数=4431.97),BRCA1(连通度=47,介数=2084.01)等;分化晚期DEG互作网络中的枢纽基因EGRI(连通度=9,介数=14),IL7R(连通度=6,介数=4),PPARG(连通度=6,介数=0)等。对中国汉族人群进行基因水平的GWAS获得了P<0.01的280个中国人群肥胖相关基因(最显著的基因为CD55,P=1.10×10-5)。这些基因的互作网络中最大的子网络由30个基因组成,这一子网络中连通度较高的几个基因是PCNA(连通度=7,介数=0),CUL4A(连通度=7,介数=0),CREBBP(连通度=6,介数=8)。本研究所发现的成脂分化或人群肥胖相关基因以及互作关系、互作网络模块为进一步揭示肥胖发生的分子机制提供了新的视角,对这些基因、模块进行深入功能研究将有助于揭示这些基因及网络互作与巴胖症间的内在联系并可能为肥胖症的诊治提供潜在的新靶点。