RNA带扭结结构的组合研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:kk527319
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要是对RNA序列结构进行组合分析,从而进一步优化现有预测RNA结构的算法。我们提出了对RNA带扭结结构的新的分类方法,更有效的推广归纳了二级结构,即我们将结构表示成简图,根据最多彼此相交的碱基对k-1来划分带扭结的结构。k=2时就是RNA的二级结构。一般上讲,彼此相交的碱基对数量越多,结构就越复杂。基于这类对RNA结构的崭新分类,我们开始了对k不相交的RNA结构的组合研究。我们确定k不相交RNA结构预测算法的搜索空间的大小,特别是局部相交数比较小的RNA结构,以及RNA具有某些属性的极限分布。区别于RNA二级结构的是,带扭结的结构因为有相交碱基对的存在而不能直接被简化成多个树结构。我们于是将k不相交的RNA扭结图表与(k-1)维Weyl房里的随机路联系起来,这个最初由陈永川教授等提出。然后,我们试图将k不相交带有最小弧长限制的RNA与具有对应限制的(k-1)维Weyl房里的随机路构造----映射,然而我们发现随着最小弧长的加大,相一一对应的(k-1)维Weyl房里的随机路里被禁止的相邻步变得更加复杂和难以控制,不利于计数的实现,而且传统的对于(k-1)Weyl房里的随机路的计数隐含了要求单位步伐关于反射墙的对称性。于是我们从k不相交RNA结构入手,把k不相交的RNA带有最小弧长,最小厚度的生成函数与k不相交的完美匹配的生成函数联系起来,确定k不相交图表带有最小弧长,最小厚度限制的双变量的生成函数,并用奇点分析的方法研究RNA带扭结结构的极限分布。然而,对RNA带扭结结构的生成函数进行奇点分析不是件简单的事情。我们相继证明了生成函数的关于奇点的解析可延拓性和奇点附近的逼近展开式,并通过Hankel圈路来应用转移定理,证明了奇点附近逼近展开式的误差项可以转移到系数的逼近误差项,即是说我们可以通过抽取奇点逼近展开式的系数来估计k不相交具有弧长,厚度等限制条件的RNA的数量。最后,我们对RNA带扭结结构的组合分析与计算生物上对RNA的预测算法相联系,将组合分析的结果与实际上的预测算法进行比较,揭示了除了能量参数影响预测算法之外,带扭结结构本身具有不可约性质。RNA二级结构的组合研究证明了RNA的二级结构空间以n-3/2·1.84n的指数级速度增长,然而动态算法以一个多项式时间的算法可以搜索整个RNA二级结构的空间。我们对带扭结结构的组合研究主要目的是为了将带扭结的空间限制到一个子空间,使得它的增长速度与RNA二级结构空间相近,这样我们期望多项式预测算法可能也存在于具有某些特征的RNA伪扭结中,也正是这样的想法,促使了后面的cross算法的出现。另外,预测算法cross也丰富了我们对RNA带扭结的全面认识,例如,叠合算法cross产生的RNA带扭结的结构具有很高的不可约性,于是我们就从结构分析这样形成的因为,证明了RNA带扭结的内含有的平均不可约数是1。   本研究主要内容包括:第一章主要介绍RNA分子模型的生物背景并讨论对带扭结RNA以最多的互相相交弧来分类的优势。第二章,基于这类崭新的分类,我们近似计数k不相交的RNA具有最短弧长的空间大小,主要将奇点分析应用于3不相交的RNA具有弧长限制结构的超临界的生成函数上。我们的结果证明了3不相交最少弧长为2的RNA数量近似于n-5.(5+√21/2)n,其中n为序列的长度。另外,通过对双变量的生成函数应用转换定理,我们运用Lévy-Cramér定理证明了RNA的配对数的极限分布,即是RNA配对数逼近正态分布的,随着k的增大,高度趋近于平均值n/2,也是最大的可能的弧数。我们的这套方法可以应用于k不相交的RNA结构,而不仅仅限于3不相交的RNA结构。在第三章,我们根据第二章提供的数据,通过对平行弧的厚度限制来继续降低带扭结的子空间大小。这里我们把k不相交的RNA结构映射成为核心结构的充气过程,然而加大平行弧的厚度会使得影响到核心结构的类型。我们在定义不同的核心结构时将这个因素考虑进去。最后,在第四章,我们研究RNA带扭结结构的不可约性质,将基本的均值,方差的研究拓展到整体的分布。我们的方法可以应用于分析t-Dyek路径的返回分布,将以往的只能计算返回变量的低阶的矩延伸到更任意高阶的矩。
其他文献
诺贝尔奖得主马柯维茨提出的均值方差模型奠定了现代证券投资组合理论的基础,马柯维茨资产投资组合模型诞生以来,不断得到改进和修正。本文正是在投资组合理论的基础上,利用
学位
本文研究三类生态数学模型:   第一部分,研究一类具有阶段结构和两种功能性反应的三种群捕食者-食饵系统.运用比较原理,得到了保证系统永久持续生存的充要条件,最后通过数值模
学位
统计过程控制(Statistical Process Control)是应用统计方法对过程中的各个阶段进行监控,从而达到改进与保证质量的目的.近些年来,由于高性能计算机科技的发展,现代统计数据
学位
本文研究了具阻尼项的拟线性波动方程的有限维整体吸引子和指数吸引子的存在性.   本文首先利用压缩映像原理证明了上述问题在空间H10(Ω)×L2(Ω)中的整体解的存在唯一性
学位
在参考文献[7]中,Cappell和Miller将原来经典的全纯挠率推广到了带(1,1)型相容联络的任意全纯丛上。这一推广使得酉丛和平坦丛都成为其特例。在这种情况下,对应的狄拉克算子
学位
本文研究了噪声对时延神经元同步动力学行为的影响,提出了通过调节噪声参数来增强或抑制同步的途径.这对神经电生理实验具有一定的指导作用.   第一部分,介绍了一些关于神经
学位
未来数年是中国场外市场发展壮大的时期,全国各地都在积极地探索场外市场建设。天津股权交易所作为中国场外交易市场的探索者,推出了以做市商制度为主的混合型交易制度,在中
学位
对于资本资产定价模型,我们最为熟悉的就是CAPM模型,并且围绕着传统的CAPM模型又衍生出了很多新的相关资本资产定价模型,但让人遗憾的是这类模型虽然有着很好的理论依据、完
学位
混合水平的因析设计广泛地被用于生物、医学、工农业生产等各类试验中,特别是四水平因子和两水平因子的混合设计被应用更为普遍。以前在Minimum Aberration(MA,Fries and Hun
学位
拉丁超立方体设计是一大类具有良好性质且被广泛应用于计算机试验中的设计。正交性对拉丁超立方体设计来说是很重要的性质。最近,文献中相继提出了一些构造任意两列正交的拉
学位