基于图形表示的RNA二级结构相似性分析及其应用

来源 :河北科技大学 | 被引量 : 0次 | 上传用户:charles93
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着转录组和表观遗传学的发展,RNA在生命活动中扮演角色的重要性不断被科学家证实。通过对RNA结构的相似性分析,可以实现RNA分类,进而可以帮助我们了解RNA的一些生物功能。基因组学研究显示,人类基因组包括约30亿个碱基对,而能翻译成蛋白质的仅有2%,98%是功能多样的非编码RNA。非编码RNA功能须依赖于一定的结构,因此,从结构的角度发现和确定非编码RNA的功能是一个非常有意义的研究课题。相比于获取一级序列来说,确定非编码RNA的二级结构是有相当大难度的。目前生物学家发现对非编码RNA二级结构进行比较研究,不仅能够为在基因组中寻找新的非编码RNA提供支持,还能对非编码RNA的功能预测提供有价值的信息。因此寻找一种新的有效的非编码RNA二级结构相似性分析方法具有重要的现实意义。假结结构是RNA分子的一种特殊结构,科学家在研究过程中发现一些重要的生物活动依赖于具有假结结构的RNA分子。但由于假结结构的特点造成对其进行预测难度比较大,因此设计算法并利用计算机对带假结的RNA二级结构进行相似性分析,成为了一种更为经济、高效的探索假结结构功能的途径。本文主要以RNA二级结构之间的相似性为研究内容,给出了一种新的可视化表示方法和基于可视化表示的相似性分析方法,主要完成以下两个方面的工作:1)提出了一种新的动态的RNA二级结构3D图形表示法,给出该表示法具有的三种性质。基于该3D图形表示法,还给出了RNA二级结构特征序列对应点的坐标映射图,并从图中直接获取了特征序列碱基分布情况。2)基于3D图形表示法的性质,我们提取了36维特征向量来代表RNA二级结构。随后将算法应用到RNA二级结构的相似性分析上,实验测试数据有三组,第一组是九种病毒RNA二级结构;第二组是17个比较复杂的RNA二级结构和16个带假结RNA二级结构;第三组是60非编码RNA二级结构。实验结果表明本文提出的3D图形表示法不仅能够对带假结的RNA二级结进行有效的相似性分析,而且能够明显区分Rfam中不同家族非编码RNA二级结构间的差异性。最后与其他九种算法进行了比较,进一步证明了本文提出的动态的3D图形表示法的有效性。
其他文献
  粗糙集理论是是由波兰学者Pawlak在1982年提出的,到目前,已经运用到决策分析、数据发掘、模式识别、电力系统等领域。2002年,刘宝碇建立了信赖性理论(TrustTheory),信赖性理
混合系数线性模型是应用性极强的一类重要的统计模型,是统计学中的一个重要分支。由于人们很难得到模型中最理想的最佳线性无偏估计,最小二乘估计成为代替它的一个好的选择,并被
在构建不动产统一登记的背景下,农村房屋物权展现出特殊性,得到了人们的重视,通过了解可知,当前的农村房屋物权公示方法和物权变动模式与城市房屋存在着较大的差异,使农村房
[目的]探讨云花生3号(Arachis hypogaeaL.)的生产潜力和推广价值,为其进一步大面积推广奠定基础。[方法]介绍云花生3号的选育经过、特征特性,并分析其产量表现及其稳定性。[
我国经济的高速发展推动了我国城镇化建设,城市的楼层随着人口密度的增加越来越高,其楼层规模也是越来越大,高层建筑的智能化系统设计成为了各个建筑企业重点研究的课题之一
本文提出了一个几何约束求解的新算法:偶图DM-分解法。这种方法首先将一个几何约束系统分解成一些具有某种偏序的较小的几何约束系统,然后按偏序关系给出一个构造序列,从而降低
多项式循环码是一类特殊的线性码,因其具有丰富的代数结构和相对简单的译码算法,近几年得到编码学者广泛的关注与研究.循环码、负循环码和常循环码都是多项式循环码的重要子类.
边界条件识别反问题属于数学物理反问题的一类经典问题,它广泛存在于理论研究和工业应用中。各向异性材料是一种新型材料,它具有热传导系数随方向改变的特性,现代科技迅速发展,对
本文主要研究了一类两自由度碰撞振动系统的周期碰撞运动,借助理论分析和数值仿真的方法对系统单碰周期n运动的存在性与共存性等性质进行了研究,并推导出能描述系统运动过程的
近年来,我国土地资源的使用现状严峻,国家迫切要求各省市尽快实现土地资源的可持续利用。土地资源一般指能够供养生物的陆地表层,包括内陆水域但排除海域在内,是人类生存发展的前