论文部分内容阅读
背景和目的:骨肉瘤是一种间质细胞发展而来的恶性肿瘤,好发于20岁以下人群,其发病率在小儿肿瘤中约占5%。骨肉瘤由软骨阶段形成肿瘤骨样组织和骨组织的过程迅速。大量研究表明,抑癌和致癌基因及其所影响的上下游分子参与了骨肉瘤的发生发展,因此探索骨肉瘤相关基因,有助于骨肉瘤的诊断、治疗和预防。与其他肿瘤相似,骨肉瘤的预后情况在个体间差异极大,因此预后标记物的寻找对于患者的治疗、判断和改善预后状况至关重要。本实验中通过基因表达谱筛选骨肉瘤癌症发生发展的相关基因,并通过蛋白质互作网络近一步获得潜在的癌症相关基因,从中筛选影响患者预后的关键基因,对筛选出的关键基因进行表达水平验证,并研究其表达水平变化对骨肉瘤进展的调控作用,以此为临床医生以及生物实验学家提供靶点和参考。材料和方法:从GEO数据库中挑选三套与骨肉癌相关的数据集,三套数据集均包含癌症样本和正常样本,用limma包对每个数据集单独进行差异分析,然后将找到的差异基因分为上调基因和下调基因至少在两套数据中存在差异的基因作为最终的候选基因。接下来,整合五个数据库的人类蛋白质互作数据,构建人类蛋白质互作网络,通过网络进一步筛选骨肉瘤的潜在相关基因并分析这些基因的功能。最后,利用TARGET数据库中骨肉瘤数据集,通过单因素筛选预后相关基因、进而通过lasso降维、多因素的COX比例风险回归分析构建影响骨肉瘤患者预后的基因模型。使用这些基因构建预后指数,对患者进行分组,分析两组间患者生存的差异情况。并且通过两套GEO数据集对筛选的基因进行验证。使用q RT-PCR和Western blot实验检测基因m RNA和蛋白质表达水平。CCK-8实验和克隆形成实验用于检测骨肉瘤细胞活力和克隆形成能力。骨肉瘤细胞侵袭力、迁移能力检测是通过Transwell侵袭和迁移实验来完成的。结果:选择P值小于0.05,差异倍数为1.2,分别对每个GEO数据集筛选差异基因,再将提取至少在两套数据集中同时上调或下调基因,共得到242个差异基因。接下来,将242个基因作为种子基因,投入到人类蛋白质互作网络中,提取与其一步近邻的节点一起构建子网,子网包含1240个基因。从子网中提取度大于15的节点,包含380个基因,与242个差异基因基因一起,共690个唯一的基因,作为下一步研究的候选基因。使用g:Profiler数据库对候选基因进行注释,表明这些基因与骨发育,骨细胞发育等生物学过程相关,还注释到了破骨细胞分化通路,骨髓,造血细胞的人类蛋白图谱中。进一步针对690个基因表达数据及生存数据进行单变量Cox比例风险回归模型,得到43个对骨肉瘤预后相关的基因,利用lasso回归分析进一步对这43个候选基因降维,筛选出12个基因与骨肉癌患者临床表现最密切的目标基因,最后,将12个候选基因通过多因素回归分析,构建有7个基因与OS患者的生存时间,生存状态最密切相关的模型,这7个基因中有两个基因即(MYO6和RPL37A)随着风险值的增加而表达值同样增高,说明这2个基因的高表达和高风险相关,为危险因素;有5个基因,即(RP2、PHB、MLH1、CSNK2B和CEBPA)均随着风险值的增加而表达值降低,说明这5个基因的高表达和低风险相关,为保护因素,并且在另外的两套GEO数据集中也验证了相同的结论。在骨肉瘤细胞中进行q RT-PCR和Western blot发现高风险基因MYO6和RPL37A在骨肉瘤细胞中呈高表达,而低风险基因RP2、PHB、MLH1、CSNK2B和CEBPA均呈低表达。此外,敲低MYO6和RPL37A表达可抑制骨肉瘤细胞增殖、迁移、侵袭和上皮至间质转化能力,过表达RP2、PHB、MLH1、CSNK2B和CEBPA能够抑制骨肉瘤细胞增殖、迁移、侵袭和上皮至间质转化能力。结论:本实验通过生物信息学信分析共筛选出7个与骨肉瘤风险相关基因,其中MYO6和RPL37A的高表达和高风险相关,为危险因素,在骨肉瘤细胞中高表达,促进骨肉瘤细胞增殖、迁移、侵袭和上皮至间质转化能力;RP2、PHB、MLH1、CSNK2B和CEBPA高表达和低风险相关,为保护因素,在骨肉瘤细胞中低表达,抑制骨肉瘤细胞增殖、迁移、侵袭和上皮至间质转化能力。其中MYO6、RPL37A、RP2和CSNK2B首次在骨肉瘤中被报道。这些预后标记有利于探寻骨肉瘤的发病机制及新的治疗靶点。