基于比较序列分析的RNA二级结构预测算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:MAGICDHJ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RNA(ribonucleic acid)二级结构预测是分子生物学中的关键问题。利用X射线晶体衍射和核磁共振(Nuclear Magnetic Resonance)等实验方法测定RNA分子的立体结构,可以得到比较精确、可靠的结果。但是,RNA分子降解速度快、难以结晶等特点使上述方法操作困难。此外,这些方法不仅费时费力而且代价高昂,在面对当前的海量生物序列时,显然是不能满足要求的。因此,像蛋白质结构研究一样,借助于数学方法和计算机等计算分子生物学手段去预测RNA的空间结构,是提高分析RNA空间结构效率的一个捷径。  本文对RNA二级结构预测问题进行了详细的阐述,并在充分汲取现有预测方法优点的基础上,将最小自由能模型与比较序列分析法相结合,创新性地提出了两种RNA二级结构预测算法,从而有效地提高了预测的精度。  具体地,本文的主要研究内容和创新点如下:  首先,介绍了RNA二级结构预测方法,包括解决该问题的数学模型、提供测试数据的结构数据库、主要算法的思想以及每种算法对应的软件。同时,本文还说明了这些软件的优缺点及各自适用范围。  其次,提出了改进的Hopfield神经网络算法来预测RNA二级结构。文中阐述了如何使用Hopfield神经网络构造环形图的最大独立集,并对其进行适当的修改以用于RNA二级结构预测。Takefuji等人采用随机的初始化方法,可能导致Hopfield神经网络的预测结果偏离了真实结构。本文通过使用同源序列来指导Hopfield神经网络的初始化和修改茎区池对算法进行了改进。实验证明预测结果的精度大大提高。  第三,提出了一种基于森林表示和遗传算法的RNA二级结构预测算法。当待测RNA分子的结构比较复杂,或同源结构的相似性较低时,Hopfield神经网络的结果容易陷于局部极优,故本文中进而提出一种基于森林表示和遗传算法的RNA二级结构预测算法。它使用Hopfield神经网络的预测结果来指导遗传算法的初始化,并根据同源序列的结构相似性原理,使用基于森林表示的RNA二级结构比对算法来从遗传算法所得的结构中选择与同源序列相似性最高的结果作为预测结果。实验证明,该算法在很大程度上解决了局部极优问题,预测结果的精度进一步提高。  第四,给出了一个RNA二级结构预测系统的实现,该系统使用了文中提出的基于比较序列分析的预测算法。  最后,本文对RNA二级预测的前景进行了展望,探讨了该领域进一步的研究方向。
其他文献
在数据库和Web技术的引导下,信息系统的数据日趋多样化、个性化和私有化,需要对数据库中的数据进行基于行、列甚至元素级的访问控制,即细粒度的访问控制。而传统在应用层部署
随着网络技术的发展,IP技术将成为语音传输的主要方式。VoIP(Voice over InternetProtocol)是一种建立在IP网络上的分组化、数字化传输技术。VoIP的出现使得人们可以通过互联
当前医疗服务正步入大数据时代,大数据将从新知识的产生、医疗质量的提高、个体化医疗和临床决策等多个层面推动医疗模式从以医师为中心向以患者为中心的改变。医疗健康是一
近年来,随着无线应用需求和市场的不断增长,特别是随着3G技术的到来,无线互联网将得到前所未有的发展。伴随着无线互联网的发展,人们的学习方式也在不断的改变,从传统的课堂
命名实体识别是目前自然语言处理研究的热点问题。MUC(Message Understanding Conferences)对命名实体的定义是:人们感兴趣的专有名词和特定的数量词,它一般可分为:人名、地
云计算的发展受到全球各国政府和企业高度重视,成为全球信息通信技术产业界公认的发展重点。同时,云计算带来了第三次信息改革浪潮,彻底改变了人们使用IT服务的方式,降低了社
数据复制是分布式数据库中提高系统可用性和可靠性的一项重要技术。长期以来,数据对象均使用静态复制方式,数据复制计划由分布式数据库管理者指定,该计划是固定的,直到管理者
Ontology是近年来知识工程领域的一个研究热点,鉴于其在知识表示和异构数据处理方面的独到之处,而在企业信息化中得到了广泛的应用。随着信息技术的飞速发展,要求构建的Ontol
对于企业来讲,客户关系己经成为企业生存发展所必须关注的问题,企业以客户为中心,不仅是要单纯的发挥主观能动性为客户提供服务,更要在客户的挖掘上下功夫,只有努力赢取客户,维持客
随着云计算的快速发展,云服务提供商将会为越来越多的用户提供服务,由于单个云服务提供商的能力是有限的,它们为用户提供按需的服务时,可能无法满足用户的服务要求,或者所提