论文部分内容阅读
人类基因组中广泛存在着选择性多聚腺苷酸化(APA)现象。polyA位点的选择是组织特异的,可能通过改变mRNA3’ UTR序列使对应的mRNA获得不同的转录后调控而影响最终的基因表达。本论文的主要工作是从多形性胶质母细胞瘤(GBM)与正常脑组织来源的MPSS数据中寻找GBM特异的APA位点,并分析APA现象是否影响RNA结合蛋白(RBP)与RNA的结合。首先我们开发了一个计算机分析流程,用于鉴定polyA位点及其对应mRNA的表达量。结果共找到约24%的基因具有APA,其中182个APA异构体(来自148个基因)在GBM和正常脑组织的表达量差异显著。MEF2D、HSBP1与PHCl基因都有两个polyA位点,其总体基因表达量在GBM与正常脑组织中无明显差异,在正常脑组织中能检出2个polyA位点,而GBM中却只有其中一个polyA位点。随后在GBM细胞系和组织以及正常脑组织中用3’ RACE PCR方法确定上述3个基因的所有polyA位点,其中两个位点为全新发现,进一步通过测序验证了这两个位点。其次,我们选取AUF1,HNRNPA1,HuR,MSI1,NCL,PUM2和SSB等7个RBP的靶点RNA序列,开发出一个基于CM模型(covariance model)的工具RNAelements (http://sysbio.zju.edu.cn/RNAelements/),找到每个RBP的特异性结合模体,并用于预测每个RBP在RNA序列上的结合位点。测试结果表明RNAelements优于同类型算法RNApromo。最后,我们应用RNAelements预测MEF2D、HSBP1与PHC1这3个基因mRNA上的RBP结合位点,发现大部分RBP结合位点位于上游polyA位点之后的可变区域。由于这7个RBP与mRNA的稳定性及翻译效率有关,因此两种APA异构体的稳定性及翻译效率会因为受不同RBP的调控而发生变化。来自doRiNA数据库的HuR蛋白质的CLIP片段及AREsite数据库的保守ARE元件也有部分位于上游polyA位点之后,从实验和计算角度同时证明了APA会改变mRNA序列上的调控位点。通过以上工作,我们发现GBM脑组织表达的mRNA会有特异的polyA位点选择偏好。选择上游polyA位点可能会使mRNA失去部分RBP的结合位点。