论文部分内容阅读
结直肠癌是常见的恶性肿瘤之一,其发病率高,早期症状不明显,转移早,对人体危害很大。转移是影响患者生存及预后的重要因素,因此筛选与结直肠癌转移及患者生存相关的分子标志物以及转移相关细胞信号调控网络中的关键调控点,对结直肠癌的早期诊断、预后评估以及药物靶点的选择均有着重要意义。基因表达谱能够反映出组织或细胞在某一特定状态下的基因表达情况。在结直肠癌发生,发展和转移的各个阶段,由于分子机制的变化,基因表达谱也会发生相应的改变。为了筛选结直肠癌转移相关分子标志物,需要对正常及肿瘤状态下的基因表达谱中变化程度较大的基因进行筛选。为了筛选与结直肠癌患者生存相关的基因,需要结合患者生存时间及基因表达调控情况进行筛选。为了寻找结直肠癌转移机制中细胞信号调控网络的关键调控点,又需要对受调控作用较多的基因进行筛选。因此本研究主要通过对结直肠癌基因表达谱数据进行挖掘与分析,通过比较转移后结直肠癌组织表达谱数据与正常结直肠组织表达谱数据,筛选与结直肠癌转移相关的分子标志物,通过分析结直肠癌患者生存时间及对应的基因表达谱的情况,筛选与结直肠癌患者生存相关的基因,并通过分析与结直肠癌转移以及患者生存时间相关基因的受调控情况,寻找结直肠癌转移分子机制中的关键调控点,进一步通过分析此基因可能的调控机制,联合细胞生物学活性的实验验证,探讨此基因在结直肠癌转移分子机制中的作用。1、结直肠癌转移相关分子标志物的筛选由于结直肠癌在转移过程中基因表达会出现相应变化,为了筛选结直肠癌转移相关分子标志物,需要寻找基因表达变化程度最大的基因。由于个体差异,生活环境等因素的不同,同一阶段的结直肠癌表达谱数据可能会有所差别,为了得到最稳定的分子标志物,选择三组结直肠癌表达谱数据分别进行筛选并取交集。通过对比正常结直肠组织数据和处于早期转移(淋巴结转移期)的结直肠癌组织数据,筛选出差异表达变化倍数为10倍且P值小于0.01的差异基因。三组筛选结果取交集,最终筛选出了与结直肠癌早期转移相关的差异表达基因共16个,其中表达上调的9个基因分别为VSNL1,PSAT1,KIAA1199,ABHD7, MMP7,JUB,CLDN1,KRT23,FOXQ1;表达下调的7个基因分别为SFRP1, SLC4A4,CHGA,GCG,GUCA2B,CLDN8,CD177。由于上调的差异表达基因在肿瘤诊断中更有意义,为了验证筛选出的差异表达基因的特异性和敏感性,将筛选出的9个上调差异表达基因基于表达谱数据进行聚类分析、主成分分析、ROC曲线分析并对未曾报道过结直肠癌表达情况的部分基因进行荧光定量PCR的实验验证。最终确定筛选出的差异表达基因特异性和敏感性较高,有望能够成为联合诊断的分子标签。2、结直肠癌转移相关基因表达调控分析由于筛选出的结直肠癌转移相关分子标志物主要基于基因的差异表达情况,且筛选出的基因数量少,特异性和敏感性较高。由于结直肠癌转移过程中表达出现变化的基因较多,为了更好的理解转移的分子机制,需要对表达出现变化的基因受调控情况进行进一步分析,筛选受调控影响较大的基因。因此,选择具有TNM分期信息的结直肠癌表达谱数据,对处于T1T2期和M1期的数据进行GSEA分析,选择niRNA结合位点和转录因子结合位点基因集,筛选出在转移后M1期表达上调基因上游调控区富集的miRNA结合位点和转录因子结合位点。通过合并数据,筛选出具有miRNA结合位点较多的基因有13个,同样,筛选出具有转录因子结合位点较多的基因有41个。对这两组基因取交集,最终筛选出同时具有较多miRNA结合位点及转录因子结合位点的基因为KLF12和CREB5。3、结直肠癌患者生存相关基因的筛选肿瘤转移与患者生存时间关系密切,肿瘤是否发生转移关系到患者的治疗及预后。由于受调控影响较大的基因在结直肠癌转移相关分子机制中更为重要,且筛选与患者生存时间相关的基因,能够对患者预后进行评估。因此以患者生存时间为切入点,筛选受调控影响较大且与患者生存时间密切相关的基因。在此,选择具有生存时间信息的结直肠癌表达谱数据,筛选并获得与结直肠癌患者生存时间相关的基因235个。对235个基因进行KEGG通路富集分析发现,这些基因主要参与细胞粘附,ECM受体相互作用,阿米巴样运动等与结直肠癌细胞迁移高度相关的分子事件。同时对235个基因上游转录因子结合位点进行富集分析,获得25个出现频率较高的转录因子结合位点,选择含有上述转录因子结合位点数大于7个的基因有30个,其中,含有上述转录因子数目最多的基因为CREB5,含有上述25个转录因子结合位点中的13个转录因子结合位点。将30个基因与结直肠癌上调表达基因集取交集,获得与结直肠癌患者生存时间相关,受转录因子调控较多,且在结直肠癌中表达上调的基因有6个,分别为STX2,PODXL,KLK6,GRB10,EHBP1和CREB5。使用表达谱数据对这6个基因进行生存分析,生存曲线显示这6个基因与结直肠癌患者生存时间密切相关,随着基因的表达升高患者生存率降低。对这6个生存相关基因构建蛋白相互作用网络,提取网络中的蛋白节点进行KEGG通路富集分析,发现这些基因所参与的信号调控网络与结直肠癌转移相关信号通路相关,表明生存时间相关的6个基因可能通过调控结直肠癌转移相关信号通路影响患者的生存期。4、CREB5基因在结直肠癌转移中的调控机制分析基于前面的分析可以发现在CREB5基因的上游调控区域富集着许多转录因子结合位点,而这些转录因子结合位点在结直肠癌转移以及患者生存时间相关的基因上游调控区域中出现频率较高。由于CREB5基因在进化上高度保守,具有较多的可变剪切体以及与结直肠癌患者生存时间密切相关,且其生存曲线显不CREB5基因对结直肠癌患者生存时间影响较大。因此CREB5基因可能为结直肠癌转移相关细胞信号调控网络中的关键调控点。使用结直肠癌表达谱数据,基于CREB5基因表达值的大小,将数据分为CREB5高表达和低表达两组并依据KEGG通路、生物进程、分子功能及转录因子结合位点基因集进行GSEA分析。由于CREB5能够和c-Jun结合成为异二聚体,而c-Jun蛋白又是AP-1的重要组成部分且转录因子结合位点富集结果显示AP-1结合位点的富集程度最高,因此具有AP-1结合位点富集类中的上调基因可能同时受CREB5所调控。在此提取AP-1富集类中的上调基因与KEGG通路富集结果中属于癌症通路富集类中的上调基因取交集,获得CREB5基因高表达组中表达上调,又具有AP-1转录因子结合位点,且属于癌症通路的关键基因共16个。将16个基因连同CREB5基因进行共表达分析,发现77.52%的基因及相关基因均具有共表达关系。通过对共表达网络中蛋白的分子功能分析发现,得分最高的分子功能均与调控细胞运动和迁移有关,主要涉及CSF1R、 MMP9、 PDGFRB、 FIGF和IL6及其相关蛋白所构成的网络,表明CREB5可能是通过调控这5个基因影响结直肠癌细胞的运动和迁移。5、体外实验验证CREB5基因对结直肠癌细胞的影响通过前面的分析可以看出,CREB5基因可能是结直肠癌转移相关分子机制中的关键调控点,为了进一步明确CREB5基因的表达变化对结直肠癌细胞的影响,使用SW480结直肠癌细胞株,通过干扰CREB5基因的表达,观察结直肠癌细胞在体外培养过程中增殖和迁移能力的变化。通过MTT体外增殖实验,平板克隆形成实验及软琼脂集落形成实验发现,CREB5基因沉默后的结直肠癌SW480细胞株的增殖能力显著下降,其克隆形成数明显减少,说明CREB5基因的表达下调能够抑制结直肠癌细胞的增殖。通过Transwell侵袭及划痕愈合实验发现,CREB5基因沉默后结直肠癌SW480细胞株的迁移能力显著下降,进一步验证了CREB5基因在结直肠癌转移中的重要作用。结论:1、筛选出9个在结直肠癌早期转移组织中表达上调的分子标志物,分别为VSNL1、PSAT1、KIAA1199、 ABHD7、MMP7、 JUB、 CLDN1、 KRT23、FOXQ1。这些分子标志物特异性及敏感性较高,有望能够成为联合诊断的分子标签。2、发现6个与结直肠癌患者生存时间密切相关的基因,分别为STX2、 PODXL、 KLK6、GRB10、 EHBP1、 CREB5。这些基因上游调控区域含有较多与患者生存时间相关的转录因子结合位点,其在结直肠癌早期转移组织中表达上调。随着这些基因的表达上调,患者生存率显著下降。3、提出CREB5基因可能为结直肠癌转移相关细胞信号调控网络中的关键调控点的新观点,其上游调控区域含有多个与转移相关的转录因子和miRNA结合位点以及多个与患者生存时间相关的转录因子结合位点。CREB5可能能够通过调控CSF1R、 MMP9、 PDGFRB、 FIGF、1L6基因影响结直肠癌细胞的运动和迁移。4、体外实验验证结果提示CREB5基因沉默能够抑制结直肠癌SW480细胞株的增殖和迁移能力。