论文部分内容阅读
前mRNA剪接是一种复杂且无处不在的核过程,它是基因表达中引起致癌错误的天然来源。此外,过去20年来的许多研究报道了在没有基因组突变的情况下癌症特异性的选择性剪接。受影响的蛋白质包括转录因子,细胞信号转导子和细胞外基质的组分。针对癌细胞上可选剪接产物的抗体目前正在进行临床试验,跨越选择性剪接区域的竞争性逆转录PCR被用作简单的诊断测试。除了与癌症相关之外,替代基因产物的性质通常与癌症中的积极作用一致;因此,可变剪接过程本身就是基因治疗的潜在目标。因此本文的主要工作如下:(1)随着大量DNA序列的快速增长,基因预测已成为生物信息学的一个难题。剪接位点预测在基因鉴定中起关键作用。因此,开发提高剪接点预测精度的新方法具有重要意义。通过将RF与三种最新的编码方法(MM1,MM2和MCM)相结合,我们证明了所提出的方法与基于SVM的方法执行大致相同并且通常更好。此外,所提出的方法简单,快速,易于使用并且可以应用于大规模人类基因组数据以鉴定剪接位点。作为未来的研究,这些方法也可用于鉴定其他调控区域,如翻译起始位点和启动子。(2)尽管已知的可变剪接事件的目录从此一直在增长,但在疾病情况下或在大量人群中工作时,通常会观察到新的异构体。鉴于完整同种型的鉴定在技术上是具有挑战性或昂贵的,将重点放在单剪接事件上作为转录组特性的替代物对于广泛的分析是富有成效的。我们提供SplAdder,一种基于RNA-Seq数据的大规模分析选择性剪接事件的新方法。SplAdder已成功应用于各种生物体的拼接分析,与其他各种先进方法相比,显示出高度的整体准确性,并可轻松应用于数千个样本的数据集。我们正在努力进一步改进SplAdder,以便本机处理高性能计算集群并生成更多交互式可视化。(3)我们已经鉴定出许多在正常和癌性组织之间差异剪接的基因。大多数实验验证的组织特异性选择性剪接事件发生在涉及细胞骨架结构,细胞外基质或细胞-细胞相互作用的基因中。这些事件中的一些报道了以组织特异性方式发生的剪接变体,并且可能由于结肠上皮和平滑肌细胞去分化而代表组织功能的丧失而不是帮助转化或转移。确定这些剪接事件的作用需要更详细的研究,但在大多数情况下,这些基因以前与肿瘤进展中的活性作用有牵连。