论文部分内容阅读
肺癌已成为发达及发展中国家和地区中癌症患者死亡的最主要原因,而非小细胞肺癌发病率占据肺癌的80%。肺腺癌是一种主要的非小细胞肺癌类型,其发病于细支气管或肺泡上皮细胞,血运丰富,具有典型的周边转移性,其死亡率约占肺癌死亡率的50%。生物信息学是整合了信息学、统计学和计算机学等多种技术分析海量生物数据所包含的信息的一门交叉学科。随着生物信息学的发展,形成了新的生物学研究模式,即利用现有的数据信息,先作理论推测,再行实验验证。从分子水平研究疾病的发生和发展,进一步指导疾病的预防、诊断和治疗。本课题以ArrayExpress数据库为研究基础,筛选肺腺癌患者与正常对照样本之间的差异表达基因(DEG),联合相互作用基因/蛋白检索工具(STRING)数据库、差异共表达的基因和边方法(DCGL)、经验贝叶斯法(EB)以及加权基因共表达网络分析法(WGCNA)对差异基因之间相互作用关系进行研究,从而提出构建基因相互作用网络的新方法。基于表达分析系统检测算法(EASE)测试,对异常表达基因进行京都基因与基因组百科全书(KEGG)通路分析。利用合并的新方法和置换检验挖掘肺腺癌不同时期(ⅠA、ⅠB、ⅡA、ⅡB、Ⅲ A、 ⅢB和Ⅳ期)激活的通路,为更好地理解肺腺癌的发病机制提供潜在分子标志和重要信息,为进一步研究肺腺癌的发生和发展、诊断及治疗提供新的方向。第一部分构建肺腺癌基因相互作用网络的新方法背景:肺癌死亡率占据恶性肿瘤死亡率首位,肺腺癌是其主要的病理类型之一,肺腺癌发病率高,五年生存率低,目前靶向药物治疗越来越多地应用到肺腺癌的治疗中。近年应用网络进行癌症基因表达研究逐渐成为热点,但仅在差异表达基因层面不足以探究疾病的发病机制。基因间相互作用关系对基因的表达具有很大的影响,全面认识基因间直接和间接的相互作用关系对全面描述细胞机制和功能具有重要的意义。此外,不同的基因相互作用网络研究方法会导致基因间相互作用关系研究结果的不一致。目的:本研究通过对肺腺癌基因表达谱分析,筛选与该肿瘤相关的差异表达基因,建立构建基因相互作用网络的新方法,获取可能与肺腺癌关系密切的相关基因和信号通路,为进一步研究肺腺癌的分子机制提供理论基础。方法:从ArrayExpress数据库中下载与肺腺癌相关的基因表达谱数据,使用RankProd包筛选差异表达基因。联合STRING数据库、DCGL法、EB法和WGCNA方法构建差异基因之间相互作用关系网络,将四种网络基因相互作用表达值合并转换后形成新的基因相互作用表达值,根据新的表达值构建了一个新的基因相互作用网络,从而创造了一种将现有的方法结合起来的新的算法,称之为合并的方法。之后对五种网络进行了拓扑特性分析;并根据合并的网络获取中心节点基因。对五种方法筛选的基因对进行通路富集分析。结果:(1)本研究筛选出941个肺腺癌差异表达基因,其中上调基因386个,下调基因555个。(2)根据已有的四种方法分别构建了基因相互作用网络,并成功建立了构建基因相互作用网络的新方法。(3)对比分析了STRING、DCGL、 EB、WGCNA和合并的方法构建的基因相互作用网络的拓扑学特性,结果表明,五种网络的节点度数经曲线拟合后的拟合系数分别是0.931、0.938、0.963、0.264和0.977,而平均最短路径长度分别为5.337、2.715、3.673、1.783和4.195。WGCNA方法创建的网络拥有最短的平均路径长度,而合并的网络具有最高的拟合系数。(4)根据合并的网络,筛选出15个中心节点基因,其中TOP2A、PAICS、BUB1、 ADAM12、FGB、NONO、UGT8、SRPX2、AOC1、AURKA、NCAPG、RACGAP1属于上调基因,IL1RL1、TAC1、DARC属于下调基因。(5)对941个差异表达基因进行通路富集分析得到7条显著富集的通路:细胞外基质受体相互作用、细胞粘附分子、p53信号通路、粘着斑、血管平滑肌收缩、细胞周期和补体系统,通过合并的方法得到的基因对主要富集在细胞周期通路和P53通路,而五种方法中得到的共同的基因对富集的通路是细胞周期。结论:(1)成功筛选出肺腺癌中941个差异表达基因,并对其进行通路富集分析,为更好地理解肺腺癌的分子机制提供理论依据。(2)成功建立了构建基因相互作用网络的新方法,网络拓扑学分析结果显示,该方法构建的网络拥有更明显的无标度网络特征,具有较高的稳健性,它能够提供一个更可靠并可行的结果,具有广阔的应用前景;WGCNA方法创建的网络更具有小世界网络性质,能够实现信息的快速集成。(3)筛选出15个中心节点基因,他们可能与肺腺癌的发病关系密切,为进一步研究肺腺癌的发病机制及治疗提供研究方向。(4)差异基因通路富集分析证明细胞周期通路与肺腺癌发病机制有密切关系。第二部分肺腺癌发展过程中激活通路的研究背景:近年来,肺腺癌的发生率和死亡率不断提高,大部分患者的治疗和预后依旧非常差。肺癌相关的基因表达谱研究、信号通路研究和靶向治疗受到越来越多的关注,基于网络的信号通路筛选和分类方法逐渐成熟,在疾病中,信号通路存在激活与未激活两种状态,激活的通路在疾病中更积极地发挥着作用,未激活的通路只是存在于疾病中,可能与此病的发病机制没有直接的关系。因此研究癌症中激活的通路对癌症的治疗和预防有重要的意义。目的:利用基因相互作用网络分析及通路活性分析,挖掘肺腺癌发展进程中激活的信号通路,为肺腺癌的诊断及治疗提供分子标志。方法:从ArrayExpress数据库中下载与肺腺癌不同时期相关的基因表达谱数据,使用RankProd包筛选差异表达基因。对差异表达基因进行KEGG通路富集分析。以差异表达基因为基础,利用第一部分中得到的新方法构建肺腺癌不同时期(ⅠA, ⅠB, IⅡA,ⅡB,Ⅲ A,ⅢB和Ⅳ期)基因相互作用网络,结合置换检验方法识别富集的通路在肺腺癌的不同时期是否被激活。结果:(1)本研究筛选出了211个肺腺癌的差异表达基因。(2)在肺腺癌发展过程的七个不同时期中,基因之间相互作用关系的多少没有明显的变化规律。(3) KEGG通路富集分析发现了肺腺癌不同时期的10条共同富集的信号通路,分别是:细胞周期、黄体酮调节的卵母细胞成熟、卵母细胞减数分裂、细胞外基质受体相互作用、血管平滑肌收缩、刺激神经组织的配体-受体互作、癌症通路、p53信号通路、肾素血管紧张素系统和肾细胞癌。(4)通路活性分析结果显示,细胞周期、黄体酮调节的卵母细胞成熟和卵母细胞减数分裂在肺腺癌疾病的各个时期都被激活。同时,p53信号通路和癌症通路在大部分时期都是被激活的,除了ⅢA期;但肾素血管紧张素系统通路在各时期都未被激活。结论:(1)根据肺腺癌差异表达基因,我们发现了10条肺腺癌不同时期共同富集的通路。(2)我们成功挖掘了肺腺癌进程中三条共同激活的通路:细胞周期、黄体酮调节的卵母细胞成熟和卵母细胞减数分裂通路,这些通路或许是肺腺癌诊断和治疗的潜在标记。