论文部分内容阅读
核酸是细胞中的基本物质之一,预测核酸的二级结构和三级结构有助于对于它们功能的研究。本文对于核酸分子的结构预测做了深入的研究,包括了 RNA分子三级结构预测,RNA分子三级结构优化,RNA分子三级结构评估,DNA分子三级结构预测以及RNA分子二级结构预测。基于我们之前提出的基于片段组装的非编码RNA三级结构预测方法3dRNA,本文第一个工作是对3dRNA方法进行了重新设计和进一步完善,包括改进二级结构树,扩充模板库,设计采样算法,设计环区模板自动构造算法等等方面。我们对改进后的3dRNA在一个包含了 32个RNA的测试集进行了测试,结果显示改进后的3dRNA经过采样后的预测结果的平均RMSD从原来的3.94 A下降到了 3.24 A,这说明我们的改进进一步提高了 3dRNA的预测精度。我们另外还验证了 3dRNA重构非标准碱基配对的能力。在无法找到准确的模板时,3dRNA的预测精度会大大下降,我们因此开发了一个基于粗粒化模型并使用蒙特卡罗模拟进行RNA三级结构优化的程序。我们设计了一个新的能量函数,使优化程序可以将直接耦合分析(DCA)的结果作为约束辅助优化。我们将优化程序与两个已知的其它方法进行了对比,预测结果的RMSD比它们的均低3-6 A。我们还设计了一个基于知识的全原子的评估RNA三级结构的统计势,3dRNAscore。它结合了基于距离的能量势和基于角度的能量势。我们对其进行了测试,在一个包含了 85个RNA的测试集中,3dRNAscore可以识别出84个RNA的天然态结构,而另外三个已知的方法分别只能识别出79,80,53个RNA的天然态结构。目前已经有很多RNA三级结构预测的方法,但是还没有预测DNA的三级结构的方法,因此我们设计了 DNA三级结构预测的方法。该方法首先搭建一个初始结构,然后利用我们设计的优化方法对初始结构进行优化。我们的方法不仅可以预测非螺旋的双链DNA的三级结构,也可以预测三链DNA和G4 DNA的结构。我们分别测试了预测这三种类型的DNA的三级结构的精度,结果显示预测三链DNA和G4 DNA的精度分别在4 A左右,预测双链DNA的精度在8 A左右。最后我们设计了一个迭代动态规划的算法来利用直接耦合分析的结果进行二级结构预测。我们与其它方法进行了比较,在一个包含有1242个RNA的测试集中,我们的方法预测有796个RNA的STY排名第一,平均STY为0.731;有526个RNA的MCC排名第一,平均MCC为0.683。我们对各个方法都搭建了相应的网站:http://biophy.hust.edu.cn/3dRNA,并将所有的功能集中到一个程序包 NSP 中:https://github.com/hust220/nsp。