论文部分内容阅读
通过对乳腺癌、肾癌、肝癌、肺癌、鼻炎癌、肠癌、胃癌、卵巢癌、膀胱癌和宫颈癌等十种常见的实体瘤的肿瘤及癌旁组织进行深度测序,获得了8.9亿条3末端mRNA序列,平均每个样本2.6千万条。这些序列共比对到21,071个基因和37790个已知的polyA位点及754,452个未知的polyA位点。这些数据丰富了我们对人类基因组和癌症基因组的认知。同已发表文献进行比较,我们的数据与以往已发表数据有较好的重复性,证明了SAPAS测序方法的稳定可靠。
通过所测得的数据,对不同肿瘤样本的3UTR长度进行分析,发现在大部分肿瘤和癌旁组织中,基因都更偏向与使用较短的3UTR。有一些基因在不同的肿瘤中具有相同的3UTR变化的趋势,如有575个基因在多个样本中出现变短的趋势,这些基因在mRNA的代谢、细胞凋亡的激活相关的相关GO条目富集。另外有一些基因虽在不同肿瘤中呈现不同的3UTR变化的趋势,但在大多数样本中,其趋势是变短的,而这些基因也出现了在mRNA的代谢、细胞凋亡的激活相关的相关GO条目富集。因此,在肿瘤中出现了倾向于使用较短3UTR的趋势,这种趋势可能与肿瘤的发生发展相关。我们对3UTR长度发生变化的基因序列进行富集分析,发现有16个已知功能的顺势作用元件在较短3UTR序列中丢失,这些元件的丢失可能与RNA结合蛋白功能的异常行使相关。如胸腺嘧啶核苷酸合酶(TS)基因序列中顺势作用元件TTAAAG可与RNA结合蛋白AUF1结合。其缺失可以造成多种疾病,如类风湿及肠、肺肿瘤等。而我们发现了由于使用较短的3UTR,造成了位于3UTR上的顺势作用元件TTAAAG的丢失,提示我们3UTR长度的异常调控影响肿瘤的发生。
通过对不同样本RNA蛋白表达量的聚类分析,在多个肿瘤中,肿瘤组织同癌旁组织可以完全区分,提示我们RNA结合蛋白在肿瘤发生中可能具有重要功能。利用权重相关系数聚类分析,我们研究了3UTR长度与RNA结合蛋白的关系。发现在不同样本中,一些RNA结合蛋白的表达与多个基因的3UTR的长度变化强烈正相关或负相关,提示我们这些RNA结合蛋白可能与这些基因的3UTR变化直接相关,值得进一步深入研究。