论文部分内容阅读
对于RNA分子结构与功能的研究是当今生物信息学领域的一个非常重要的课题。随着研究的不断深入,RNA正在从人们眼中简单的、线性的、功能单一的分子形象演变成今天种类多样,结构复杂,功能特异的新个体,特别是大量非编码RNA的发现以及对于其功能特性的分析,使得人们逐步认识到RNA世界的多样性和重要性。RNA已经不仅仅被认为是DNA到蛋白质之间的一种信息传递中介,它已经逐渐在中心法则中取得了与DNA和蛋白质同等重要的地位。RNA组学(Rnomics)或者核糖组学(Ribonomics)也成为继基因组学(Genomics),蛋白质组学(Proteomics)等一系列系统生物学概念之后的一个崭新的系统交叉学科。RNA分子结构与功能的研究不光依赖于实验手段,同时也需要借助生物信息学的方法进行分析,特别是目前对于RNA分子的研究已经进入了一个大规模的,高通量的,系统分析的时代,为了更加深入探索RNA结构与功能的关系,了解RNA在生命活动中的各种工作机制,大力发展RNA研究方面的生物信息学方法和技术显得尤为重要。在这样一个热点研究背景之下,本论文从算法设计以及计算机软件平台构建的角度,对于RNA分子结构相关的计算生物学问题进行研究。论文内容涉及RNA分子结构的表示,RNA结构预测,RNA结构比对,RNA结构的压缩和信息度的衡量,RNA综合分析平台的构建,以及非编码RNA基因预测等若干问题,属于计算机,生物,医学交叉的前沿学科领域。论文的主要内容与成果概括如下:(1).对于RNA分子的结构表示理论进行了系统的分析,对于各种结构表示方法进行比较,同时提出了一种基于6-D编码的RNA分子二级结构表示方法,将RNA构象的二级结构转化为结构矩阵,提取矩阵奇异值向量作为其主要结构特征,从而从代数矩阵论角度给出了其分子结构的精确描述。(2).对于RNA分子二级结构的预测算法进行了系统的阐述,基于图论极大独立集思想提出了一种基于Hopfield网络进行并行预测的有效算法,进一步提高了RNA二级结构预测的效率。(3).对于RNA分子二级结构的各种相似度衡量算法进行了探讨和比较,采用6-D编码设计了一种利用矩阵奇异值分解进行结构比对的算法。(4).基于上述相似度提出了一种新的模糊核聚类(Kernel Fuzzy C-means,KFCM)算法,应用于RNA二级结构构象的聚类分析中。结果表明该聚类算法对于RNA构象分析十分有效。(5).构建了RNA结构比对以及结构构象聚类的整合软件平台(RNACluster),将基于最小生成树(Minimum Spanning Tree,MST)表示的聚类算法应用于RNA分子的构象聚类、RNA构象转换(RNA conformational switches)以及非编码RNA预测当中。(6).首次提出了RNA二级结构压缩的概念,设计了一种利用上下文无关文法压缩RNA二级结构的算法,构建了相关软件(RNACompress),该软件可以有效的对于RNA一级序列及二级结构同时进行建模,并且进行无损压缩。(7).首次引入基于压缩的Kolmogorov复杂度来衡量RNA结构的信息度。并将其应用于11种GTP-binding RNA核酸适体(aptamer)的结构信息度衡量及其绑定活性与结构信息复杂度关系的定量研究中。(8).对于非编码RNA的相关概念及其基因预测算法进行了论述。系统总结了非编码RNA相关的网上平台与数据库资源。对于非编码RNA计算生物学领域的未来研究方向和研究热点提出了自己的看法,并作了相应展望。