论文部分内容阅读
1 研究背景与目的近几十年来,贲门腺癌发病率逐年上升,一经发现一般都在中晚期,治疗后效果不如早期好,而不同的地区发病率不同,值得引起广泛关注。尽管对贲门腺癌的环境因素的研究取得了进展,但目前认为它们不足以完全解释观察到的不同地区发病率差异。贲门腺癌不仅显著的地域性分布差异与食管癌保持一致,而且在不同的高低发地区的发病率也存在显著差异。未知的外源性暴露攻击基因导致体细胞突变,可能是造成不同地区不同发病率的原因之一。通过将本实验室已经做过全基因组外显子测序的贲门腺癌患者的结果对比,试图找到相关的基因和突变特征,由此关联分析在食管癌高低发区贲门腺癌的发病率不同的因素,探究贲门腺癌在食管癌高低发区分子水平的发病机制及预后,做到对相应发病危险因素的规避、早期发现,及时治疗,靶向治疗,降低贲门腺癌死亡率,提升人们幸福生活水平。2 材料与方法2.1 样品的准备本实验室研究生到医院收集样品,抽取患者的外周血,在癌组织及癌旁组织在离体30分钟内,由相关技术人员进行解剖、分装、标号并用液氮保存运回本室,然后由实验室经验丰富的工作人员进行苏木精染色和组织学病理学检查,评估癌细胞,癌旁细胞等样本是否正确,对癌细胞进行肉眼评分,只选择癌细胞≥50%的样本进行全基因组外显子测序。贲门腺癌的癌组织、癌旁组织和外周血分别用用T、N和B编号。2.2 WES分析方法2.2.1 高频突变基因统计使用MuSiC软件。MuSiC以所有或部分肿瘤样本为背景,对高频突变基因进行卷积检验(convolutiontest,CT),保留Q-value<0.1的基因作为高频突变基因。2.2.2 拷贝数变异分析拷贝数变异(Copy number variation,CNV)表现为基因组片段的拷贝数增加或者减少,是基因组结构变异(Structural variation,SV)的重要组成部分,可分为缺失(Deletion)和重复(Duplication)两种类型,是一种重要的分子机制。CNV能够导致包括癌症在内的复杂疾病,对于染色体水平缺失、扩增的研究已经成为肿瘤研究热点。采用Control-FREEC软件(http://bioinfo-out.curie.fr/projects/freec/)(Boeva V et al.2011)对Tumor及Normal成对样本检测 Somatic CNV,基于比对到参考基因组上Reads的深度分布情况检测拷贝数的变化,得到统计结果。2.2.3 突变频谱和突变特征分析我们对体细胞SNV的突变进行了多个角度的分析,包括突变频谱和突变特征。突变特征是多种突变过程催生了体细胞突变,不同的突变过程产生特定的突变类型组合。考虑点突变位点上、下游各1bp位置的碱基种类,可以将点突变分为96种类型。突变特征分析是根据各肿瘤样本中96种突变类型的频率,通过非负矩阵分解(Nonnegative Matrix Factorization,NMF)的方法将点突变分解为6个不同的突变特征。取每个突变特征的所有值的中位数作为阈值,超过阈值的为阳性,低于阈值的为阴性。将样品突变特征与COSMIC网站中已知的突变特征SBS进行聚类(http://cancer.sanger.ac.uk/cosmic/signatures),利用与样本突变特征相似的已知特征的注释信息解释样本突变。从这些结果中,我们可以清晰地了解到癌症突变在点突变水平上的特征。通过突变频谱分析我们可以得知各个肿瘤样本各种类型突变(如C>T/G>A)的数量及样本是否有某种类型突变的偏好性。通过分析体细胞突变特征,可以研究不同地区的体细胞点突变特点。3结果3.1 贲门腺癌临床病理特征246位GCA患者中,男性有199位,女性有47位,男女比为4.2:1。高发区有213位,低发区有33位,高低发区比例为6.5:1。性别等在高低发区无统计学差异。3.2 高发区贲门腺癌vs低发区贲门腺癌的高频突变基因高发区贲门腺癌共找到224个高频突变基因。低发区贲门腺癌共找到6个高频突变基因:TP53、KCNN3、ABCF1、RBM27、MBD4、PRRT2。高发区和低发区都有的高频突变基因有5个:TP53、KCNN3、ABCF1、RBM27、MBD4。低发区特有的1个高频突变基因是PRRT2。3.3 贲门腺癌的高频突变基因与患者预后的关系这些高频突变基因中,在预后有明显统计学差异的有5个基因。在高发区:高频突变基因COL4A4突变的患者预后较好(p=0.013),而ARID1A、KIAA2018、SYCP1、TREML2 突变的患者预后较差(P=0.016;P=0.0028;P=0.042;P=0.0046)。3.4 高低发区贲门腺癌关于CNV结果对比高低发区患者的拷贝数变异进行了分析,发现高发区和低发区中有922个显著差异的拷贝数变异,扩增有467个,缺失有455个。我们将有显著差异的922个拷贝数变异所在的基因与之前分析的高发区和低发区的高频突变基因进行比对,发现在5个高发区特有的高频突变基因(STAT4、CEBPZ、RBM45、TIA1、NOP9)中,存在6个拷贝数变异,在低发区特有的高频突变基因中无拷贝数变异。3.5 高低发区贲门腺癌在突变类型的对比将6种突变特征在高低发区进行统计学分析,Signature-4在高低发区的阳性率有统计学差异(P=0.008),且阳性率差异较大,而其它突变特征无统计学差异。通过过突变特征余弦相似度热图得知,Signature-4与SBS5相似性最高。4结论4.1 高低发区贲门腺癌患者发生的高频突变基因不完全一致,或许是不同外源性暴露因素导致患者发生不同的体细胞突变,从而导致高低发区的发病率不同。4.2 高低发区贲门腺癌患者突变特征的差异可能也与外源性暴露因素吸烟有关。4.3 高低发区贲门腺癌患者早期发现和靶向治疗等所用分子标志物可能不同。4.4 在高发区,COL4A4基因突变的患者预后较好,ARID1A、KIAA2018、SYCP1、TREML2基因突变的患者预后较差。4.5 TP53在高低发区贲门腺癌患者中都有很高的突变频率。