论文部分内容阅读
研究背景:随着社会的高速发展,女性承担着日益重要的社会角色,然而生活方式及环境的变化使肿瘤发生率不断提高,乳腺癌(breast cancer,BRCA)已一跃成为目前全球女性发生率最高的恶性肿瘤,发病率不但逐年提升且有年轻化趋势。三阴性乳腺癌(triple negative breast cancer,TNBC)向来被认为是最“毒”的乳腺癌,占乳腺癌总数的10%~15%,具有发病年龄轻、肿瘤体积大、病理分级高、转移时间早、生存率低等特征,目前无特异有效的治疗方法。因此找寻新的具有诊断及临床治疗意义的分子靶标十分迫切。Micro RNA(mi RNA)在肿瘤学里已经研究近20年,作为真核生物内一类长度约18-25nt的非编码RNA,它参与转录后基因表达的调控,与肿瘤的增殖、迁移、凋亡等生物学过程息息相关,目前普遍认为其与基因表达间呈负相关。但有研究表明mi RNA还具有激活基因的作用,这具有颠覆性的发现又重新掀起了一番“micro”热潮,研究表明这类mi RNA可能与超级增强子(SEs)区域密切相关,并且可激活增强子RNA(e RNA)的表达,促进基因转录,已有研究证实多种癌症的基因组变异区存在SEs的富集。H3K27ac是H3组蛋白第27位赖氨酸乙酰化,它主要富集在增强子和启动子区域,所以H3K27ac常作为增强子的潜在标志物,并与增强子的活性相关。近年国内一项重大研究利用H3K27ac标记出许多可充当增强子调节器的mi RNA,证明其可以正向调控邻近基因的表达。这一发现给肿瘤发生机制研究指出了一条新道路,然而在三阴性乳腺癌中这种mi RNA正向调控基因转录的相关研究尚缺乏。本研究运用公共数据库数据进行统计学分析,利用H3K27ac的标记作用,意在探讨mi RNA充当增强子调节器正向调控三阴性乳腺癌基因转录的可行性,并对找到的上调基因行计算SMD、s ROC和HR综合分析,意在找到三阴性乳腺癌潜在的诊断指标和治疗靶点。研究目的:探索增强子调节器mi R-200c-3p在三阴性乳腺癌中使下游基因表达上调的可行性,并验证这一途径在三阴性乳腺癌发生发展中的作用及其临床意义。研究方法:1.挖掘TCGA、GEO、Array Express、SRA和ONCOMINE数据库中的乳腺癌mi RNA成熟体表达谱,将所下载的数据分成TNBC vs normal、non-TNBC vs normal以及TNBC vs non-TNBC三个亚组,整理分析后分别得到各亚组的差异mi RNA。相互取交集后,得到TNBC特异性高表达的mi RNA,并运用mi Rbase数据库查找上述mi RNA的前体。2.运用Cistrome Data Browser数据库搜索H3K27ac在三阴性乳腺癌细胞系中的表达情况,使用UCSC浏览器筛选出距离H3K27ac富集峰10kb内的特异性mi RNA。利用计算生物学方法在已下载的公共数据中,对结果理想的mi RNA在三阴性乳腺癌中的表达情况进行验证,并分析其临床意义。3.利用UCSC浏览器和GEPIA数据库,找出该理想miRNA下游100kb范围内的高表达基因。运用统计学软件对高表达基因计算SMD、s ROC和HR,并探究其对三阴性乳腺癌预后的影响。4.对高表达基因进行GO功能注释、KEGG通路分析和PPI网络构建。验证PPI网络中关系紧密的共表达基因在三阴性乳腺癌中的表达情况,结合文献报道,分析它们的临床意义。研究结果:1.通过挖掘公共数据库,总共从TCGA、GEO、Array Express、SRA和ONCOMINE数据库下载得到38个乳腺癌mi RNA成熟体表达谱,整理分析后得到8个在TNBC中特异性高表达的mi RNA。2.通过Cistrome Data Browser数据库筛选出5个存在H3K27ac富集的mi RNA,选择mi R-200c-3p为最理想的mi RNA,并在所下载的公共数据集中证实mi R-200c-3p在三阴性乳腺癌中的表达水平高于正常对照组织(SMD=0.56,95%CI:0.00-1.13)。但其表达水平与患者年龄、肿瘤分级、淋巴结转移、远处转移和临床分期间的差异未发现统计学意义(P>0.05),并且mi R-200c-3p的高表达与三阴性乳腺癌的预后情况也未发现统计学意义(P>0.05)。3.对mi R-200c-3p下游100kb内的2个高表达基因PHB2和EMG1行计算SMD,PHB2在三阴性乳腺癌中的表达无统计学差异(P>0.05),EMG1在三阴性乳腺癌中的表达高于正常对照组织(SMD=0.52,95%CI:0.19-0.84),同时也高于非三阴性乳腺癌组织(SMD=0.49,95%CI:0.33-0.65),生存分析结果表明EMG1与三阴性乳腺癌的预后差异无统计学意义(P>0.05)。4.通过GO和KEGG分析发现EMG1的生物学功能和通路主要集中于细胞分裂和细胞周期等方面,通过PPI得到3个与EMG1密切相关的基因,与正常对照组织相比,它们在三阴性乳腺癌中呈高表达,差异有统计学意义(P<0.05),并且它们的高表达潜在预示了三阴性乳腺癌的预后不良。结论:1.mi R-200c-3p在三阴性乳腺癌中高表达,且H3K27ac富集峰与mi R-200c-3p位置重叠,说明该mi RNA中可能存在增强子活性。但mi R-200c-3p与三阴性乳腺癌的患病年龄、临床分期和预后差异间均未发现统计学意义。2.mi R-200c-3p邻近下游存在高表达基因EMG1,初步验证H3K27ac标记的mi RNA可能充当增强子调节器正向调控基因转录这一机制的可行性。3.EMG1的共表达基因DKC1,RRS1和WDR12均为核糖体相关蛋白,且在三阴性乳腺癌中呈高水平表达,说明核糖体生物合成可能在TNBC的发生发展中发挥重要作用,有望成为新的诊断及治疗靶点,具体相关机制还有待后续研究。