论文部分内容阅读
研究背景:最新统计结果显示,乳腺癌已成为全球女性发病率和死亡率最高的恶性肿瘤,并呈发病年龄年轻化趋势。而我国的乳腺癌负担正加速上升,其在全球所占的比重亦在增加。与西方发达国家发病上升趋缓、死亡率下降的形势不同,我国乳腺癌发病率和死亡率均呈明显上升趋势,乳腺癌的生存率也低于发达国家;城市和农村在乳腺癌发病、死亡和生存的现况和发展趋势方面的明显差异是我国乳腺癌疾病负担的重要特征。乳腺癌的诊治预防形势严峻。幸运的是,2012年二代测序技术的应用以及一系列具有里程碑意义的研究为我们从基因角度研究乳腺癌取得重大突破。世界各地实验室均开始开展大规模的基因组学研究,以鉴别乳腺肿瘤的遗传改变,完善乳腺癌基因图谱,尝试提出乳腺肿瘤个体化治疗的依据。现有研究提示:p16、PTEN、ATM以及BRCA1、BRCA2、HER-2、p53等与乳腺癌密切相关。但其机制未明,其具体作用存在争议。众所周知,复发和转移是影响乳腺癌预后的主要因素。乳腺癌的预后相关标志物的研究还处于初步研究阶段,已有研究证实:mi RNA-21,mi RNA-210,CXCR4,ALDH1A1,BCL2,和BRCA1/BRCA2等分子水平的标志物与乳腺癌发病预后相关,但其具体机制未明。针对乳腺癌预后相关的基因的专项研究较少,基因水平的标志物尚待更多研究进一步证实发现。综上所述,乳腺癌的诊治预防形势严峻,而乳腺癌基因的研究意义重大,可能会给全世界乳腺癌患者带来福音,但目前尚未明确有效的特定基因检测来指导诊疗,急需大量研究来筛选出一些敏感性和特异性较高的基因,并探讨其临床预后相关应用价值,为乳腺癌的预防干预、早期诊断、治疗和评价预后提供重要的依据和思路。目的:本研究从TCGA数据库(The Cancer Genome Atlas)获取样本数据,通过对其挖掘分析,筛选出差异表达的基因,并进行KEGG pathway(Kyoto Encyclopedia of Genes and Genomes)聚类分析,获得与肿瘤信号通路相关的一些敏感性和特异性较高的基因,并探讨其临床预后相关应用价值,为乳腺癌的预防干预、早期诊断、治疗和评价预后提供重要的依据和思路。方法:1.基于TCGA数据库获取乳腺癌样本数据。2.通过SAM分析获取差异表达基因,筛选条件为:P<0.01,Fold-change>2。3.进行KEGG pathway聚类分析,获得与肿瘤信号通路相关的差异表达基因。4.通过ROC曲线筛选具有诊断意义的,即敏感性和特异性较高差异表达基因。5.通过Graph Pad Prism6对筛选出的基因进行临床预后相关性分析,Log-rank主要分析远期预后,Breslow分析近期预后,P<0.05说明该基因高低表达对病人预后存在显著差异。结果:1.基于TCGA数据库可获得变化倍数为2以上的上调的差异基因1906个,下调的差异基因2200个。2.进行KEGG pathway聚类分析,可筛选出参与肿瘤信号通路的上调差异基因1608个和下调差异基因1964个,上调基因参与细胞周期(Cell cycle)、p53信号通路(p53 signaling pathway),细胞外基质受体相互作用(ECM-receptor interaction),细胞粘附分子(Cell adhesion molecules),肿瘤转录失调(Transcriptional misregulation in cancer),DNA复制(DNA replication)等25条信号通路;下调基因参与环磷酸鸟苷酸-环磷酸鸟苷酸依赖的蛋白激酶信号通路(c GMP-PKG signaling pathway),癌症通路(Pathways in cancer),PI3K AKT磷脂酰肌醇3激酶-蛋白激酶B信号通路(P13K-Akt signaling pathways),细胞外基质受体相互作用(ECM-receptor interaction),环化腺核苷一磷酸信号通路(c AMP signaling pathway),细胞因子-细胞因子受体的相互作用(Cytokine-cytokine receptor interaction)等32条信号通路。3.通过ROC曲线筛选具有诊断意义的,即敏感性和特异性较高差异表达基因,其中上调基因675个,下调基因826个。通过倍数变化(Fold Change)进一步筛选出变化较大的上调和下调基因,分别通过ROC曲线评估其诊断价值,设定条件为AUC>0.900筛选出对乳腺癌诊断能力较强的上调和下调的差异基因。对比结果是:上调的差异基因中,ESPL1,PTTG1,PLK1,PKMYT1的ROC曲线中AUC均>0.900,诊断能力大;下调的差异基因中,PPARG,ZBTB16,RXRG,KIT的ROC曲线中AUC均>0.900,诊断能力大。4.上调的差异基因中,ESPL1的Log-rank p0.0915>0.05,Breslowp0.5615>0.05,其高低表达与临床近远期预后均无明显差异;PKMYT1的Log-rank p0.0615>0.05,Breslowp0.0794>0.05,其高低表达与临床近远期预后均无明显差异;PTTG1的Log-rank p0.5502>0.05,Breslowp0.1775>0.05,其高低表达与临床近远期预后均无明显差异;PLK1的Log-rank p0.0071<0.05,Breslowp0.0010<0.05,其高低表达与临床近远期预后均存在明显差异,PLK1高表达是肿瘤病人近期和远期生存预后的危险因素。下调的差异基因中,KIT的Log-rank p0.0172<0.05,Breslowp0.0062<0.05,其高低表达与临床近远期预后均存在明显差异,KIT低表达是肿瘤病人近期和远期生存预后的危险因素;PPARG的Log-rank p0.0170<0.05,Breslowp0.0617<0.05,其高低表达与临床远期预后存在明显差异,与临床近期预后无统计学差异,PPARG低表达是肿瘤病人远期生存预后的危险因素;RXRG的Log-rank p0.0155<0.05,Breslowp0.0522>0.05,其高低表达与临床远期预后存在明显差异,与临床近期预后无统计学差异,RXRG高表达是肿瘤病人远期生存预后的危险因素;ZBTB16的Log-rank p0.0352<0.05,Breslowp0.2795>0.05,其高低表达与临床远期预后存在明显差异,与临床近期预后无统计学差异,ZBTB16高表达是肿瘤病人远期生存预后的危险因素。结论:综上所述,本研究分析了基于TCGA数据库获取的关于乳腺癌的基因表达谱的生物信息,发现上调的差异基因中,ESPL1,PTTG1,PKMYT1诊断能力大但其表达高低与临床近远期预后无关,PLK1诊断能力大且其高表达是肿瘤病人近期和远期生存预后的危险因素;下调的差异基因中,PPARG,ZBTB16,RXRG,KIT诊断能力大;KIT低表达是肿瘤病人近期和远期生存预后的危险因素;PPARG低表达是肿瘤病人远期生存预后的危险因素;RXRG高表达是肿瘤病人远期生存预后的危险因素;ZBTB16高表达是肿瘤病人远期生存预后的危险因素。他们可作为乳腺癌指导诊断,预测预后及评估治疗方案的有效指标。