基于RNa-seq可变剪接预测算法的研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:zhanxi581018
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
前mRNA剪接是一种复杂且无处不在的核过程,它是基因表达中引起致癌错误的天然来源。此外,过去20年来的许多研究报道了在没有基因组突变的情况下癌症特异性的选择性剪接。受影响的蛋白质包括转录因子,细胞信号转导子和细胞外基质的组分。针对癌细胞上可选剪接产物的抗体目前正在进行临床试验,跨越选择性剪接区域的竞争性逆转录PCR被用作简单的诊断测试。除了与癌症相关之外,替代基因产物的性质通常与癌症中的积极作用一致;因此,可变剪接过程本身就是基因治疗的潜在目标。因此本文的主要工作如下:  (1)随着大量DNA序列的快速增长,基因预测已成为生物信息学的一个难题。剪接位点预测在基因鉴定中起关键作用。因此,开发提高剪接点预测精度的新方法具有重要意义。通过将RF与三种最新的编码方法(MM1,MM2和MCM)相结合,我们证明了所提出的方法与基于SVM的方法执行大致相同并且通常更好。此外,所提出的方法简单,快速,易于使用并且可以应用于大规模人类基因组数据以鉴定剪接位点。作为未来的研究,这些方法也可用于鉴定其他调控区域,如翻译起始位点和启动子。  (2)尽管已知的可变剪接事件的目录从此一直在增长,但在疾病情况下或在大量人群中工作时,通常会观察到新的异构体。鉴于完整同种型的鉴定在技术上是具有挑战性或昂贵的,将重点放在单剪接事件上作为转录组特性的替代物对于广泛的分析是富有成效的。我们提供SplAdder,一种基于RNA-Seq数据的大规模分析选择性剪接事件的新方法。SplAdder已成功应用于各种生物体的拼接分析,与其他各种先进方法相比,显示出高度的整体准确性,并可轻松应用于数千个样本的数据集。我们正在努力进一步改进SplAdder,以便本机处理高性能计算集群并生成更多交互式可视化。  (3)我们已经鉴定出许多在正常和癌性组织之间差异剪接的基因。大多数实验验证的组织特异性选择性剪接事件发生在涉及细胞骨架结构,细胞外基质或细胞-细胞相互作用的基因中。这些事件中的一些报道了以组织特异性方式发生的剪接变体,并且可能由于结肠上皮和平滑肌细胞去分化而代表组织功能的丧失而不是帮助转化或转移。确定这些剪接事件的作用需要更详细的研究,但在大多数情况下,这些基因以前与肿瘤进展中的活性作用有牵连。
其他文献
模式匹配是计算机应用领域重要的研究方向之一,广泛应用于入侵检测、信息检索、生物科学等方面。随着计算机网络技术的飞速发展,信息量呈爆炸式增长,如何提高模式匹配算法的性能
乳腺癌是全世界女性最常见的恶性肿瘤之一,且其发病率和死亡率在近年呈现迅速增长的趋势,早期的发现与确诊是降低乳腺癌死亡率的关键,也是早期诊断的关键。其中,肿块是乳腺疾
图像的边缘细节信息直接影响图像的视觉质量。传统的超分辨算法会出现边缘模糊和锯齿等现象,本课题分析了国内外的成果,把张量能保持图像局部结构信息的特征引入到超分辨中,根据
无线传感器网络(Wireless Sensor Network-WSN)作为物联网的“末梢神经”,是一种综合数据感知与采集、融合处理和信息传输功能于一体的无线自组织智能群体型网络信息系统,其
随着信息技术的不断发展,信息获取能力的不断提高,人们往往需要分析和处理各种高维数据,如:海量web数据、遥感图像、微阵列数据等等。这些高维数据通常会导致机器学习算法的计算
频繁模式挖掘是数据挖掘领域的重要算法。频繁模式挖掘在事务数据库、时间序列数据库和许多其他类型数据库的挖掘研究中都得到了广泛的应用。然而,传统的Frequent-patternGrow
近年来,大量研究表明,脑网络在结构和功能上具有一定的拓扑结构和组织特征,并能够提供稳定的生物标记,这为人们理解大脑机制提供了新的视角。因此,针对脑网络的研究吸引了大量学者
MapReduce是Google开发的一种并行分布式计算模型,已在搜索和处理海量数据领域得到了广泛的应用,Hadoop是它的开源实现。MapReduce编程模型因为其良好的可扩展性、高可用性以及
针对聚合签名系统中的密钥泄漏问题,本文将密钥隔离机制引入到聚合签名系统中,提出了三种不同的密钥隔离聚合签名方案。取得的研究成果如下:1.提出了密钥隔离聚合签名的概念,
群体异常行为检测与识别技术是指通过分析视频中的群体行为实现自动检测群体异常行为并识别出其类型的过程。本文在研究和分析了现有的群体异常行为识别关键技术的基础上,对群