RNA二级结构预测方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:xsxiaomo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着对RNA(Ribonucleic Acid)研究的逐步深入,RNA在进行、遗传过程中的重要作用也越来越显著。RNA分子不仅充当着生物细胞中遗传信息的载体,还具有一系列重要的功能,如催化RNA剪接,加工和修饰RNA前体,调控基因表达等,这也促使了人们对RNA功能进行深入研究。而RNA的功能与结构是密切相关的,因此,通过研究RNA的二级结构,进而深入挖掘、阐述其功能就成为分子生物学中的重要研究课题。由于使用传统的实验手段(如X射线晶体衍射和核磁共振)去测定RNA的晶体结构虽然比较精确可靠,但代价昂贵,且费时费力。所以,借助于计算机实现的各种算法对RNA二级结构进行预测就成为当前国内外公认的主要方法。RNA二级结构预测方法经过近30年的研究,到目前为止,已经有众多的算法。这些算法有的已经非常成熟,例如最小自由能算法,其预测精确度有时能达到90 %以上,但是它不能预测RNA假结。而目前的众多其它预测算法也大都各自存在着问题,如时间复杂度高,对序列的长度有限制等等。因此,对RNA二级结构预测方法的研究仍然是RNA研究中的重点课题。本文正是在这种环境下,对RNA二级结构预测方法进行深入研究。论文对目前的RNA二级结构预测方法进行了分析、总结,然后归纳为四类:(1)比较序列分析方法(2)动态规划算法(3)组合优化算法(4)启发式算法。通过对这四类方法的研究、分析、比较,论文找到了新的预测方法的研究思路,为本文工作的完成奠定了坚实的理论基础。首先,本文研究了马尔可夫链在RNA二级结构预测中的应用,提出了基于马尔可夫链的RNA二级结构预测新方法。根据自由能,构建马尔可夫链的转移概率矩阵,进而构建RNA-ML,来寻找自由能最小的RNA二级结构。论文从公用数据库(Genomic tRNA Database)中选取六条tRNA序列进行预测,将其预测结果和目前著名软件Mfold和RNAStructure的预测结果进行比较。实验结果表明,本文建立的RNA-ML优于Mfold,对于单条序列与RNAstructure接近。同时,本方法降低了时间复杂度,提高了敏感性和特异性,对trna序列执行起来速度较快,也可以应用于较长的RNA序列,弥补了大部分方法的预测时间随着序列长度增加成立方甚至四次方增长的缺陷。其次,本文研究了隐马尔可夫模型在RNA二级结构预测中的应用,提出了基于隐马尔可夫模型的RNA二级结构预测新方法。以最小自由能为基础,建立各茎区间的转移概率矩阵、观察值概率矩阵,进而构建RNA-HMM,来寻找自由能最小的RNA二级结构。论文选取PseudoBase中的6条结构相对较复杂的RNA序列进行预测,将其预测结果和pknotsRG软件预测结果进行比较。实验结果表明,本方法的结果准确率比pknotsRG有所提高,通用性比较好。同时,也缩短了预测时间,提高了敏感性和特异性。最后,本文研究了粒子群算法在RNA二级结构预测中的应用,提出了基于粒子群算法的RNA二级结构预测方法。结合PSO、最小自由能、被选择茎区的数量和平均长度,本文设计了一个新的适应度函数,建立了IPSO。论文分别用RNAPredict,H-Helix PSO和IPSO进行RNA二级结构预测,进而来比较它们RNA二级结构的自由能。结果表明,用IPSO方法预测到的最优茎区组合的自由能低于其它方法,能够找到更为稳定的二级结构,对于长序列IPSO的性能优势更为显著,而且具有较快的收敛速度,通过较少的迭代就可以找到更好的二级结构。论文又将标准粒子群优化算法(SPSO)、标准遗传算法(SGA)、蚁群算法(ACO)和IPSO方法的预测结果进行了比较。结果表明,由于高效的目标函数,IPSO的性能明显高于其它三种方法。为了验证IPSO方法在RNA二级结构预测中的有效性,本文将IPSO、Mfold和RnaPredict的预测结果进行了比较。结果表明:IPSO在其中三条序列上的敏感性和特异性高于Mfold,而在其余两个序列的测试结果低于Mfold,IPSO方法的在全部序列上的敏感性和特异性均高于RnaPredict,这也证明了本文所设计的目标函数是可行的、更有效的。
其他文献
借助计算机图像识别与处理技术,提出一种新的快速判断电厂化学水处理控制系统中,混床再生时阴、阳树脂在再生塔中分层状态的方法。侧重介绍其实现过程,即程序流程,并对原理作适当
无锡供电局采用总体数据规划辅助工具软件成功地进行了管理信息系统总体设计。该总体设计对全局进行了较全面的数据总体规划,制定了切实可行的数据管理标准,得出具有行业共性的
梁鸿的《神圣家族》是继其《中国在梁庄》《出梁庄记》后又一全新的力作。其创作眼光转移到了乡镇知识分子的身上。从作品中知识分子生存境遇出发,发现其具有悖论式特征,并剖
四气门汽油机双滚流为主,滚流有助于改善燃烧过程,本文用ALE方法进行了四气门汽油机中滚流运动的三维数值模拟,计算结果显示了在滚流缸内三维空间中形成及演变过程,及其湍动能场的变
介绍一种静压钢管桩基础,钢管桩与钢管塔采用套接或法兰连接,较好解决城网建设和改造中输配电线路在城市施工中的难题/
本文建立了一个加压喷动流化床煤部分气化的数学模型,根据流场对喷动流化床进行了分区,在喷动区采用类似气力输送流动模型,在周边环行区采用流化床模型。模型中考虑了设备几何特
本章试图寻求描述火焰锋面动态特性的方法,以解释微重力环境下出现的V型火焰锋面的涟漪现象。采用线性稳定性理论从经典的G方程中导出了描述火焰锋面动态结构的一阶偏微分方程。
轻工总会最近提出对外商投资中国食品工业的鼓励、限制与禁止的项目。鼓励投资的项目有:甘蔗、甜菜优良品种的开发;糖厂用高压、高效蔗糖锅炉和专用发电机组;引进果蔬脆片、
由国家科委成果办和清华大学紫光集团联合主办的"’97科技成果洽谈会"将于5月26日~28日在北京皇苑大酒店举行。此次洽谈会汇集了国家科委、北京各高等院校、中科院、国家专利