基于神经网络的RNA二级结构预测算法研究

来源 :福建农林大学 | 被引量 : 1次 | 上传用户:MHSLOVE
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RNA是生物科学领域的一个重要的生物大分子,参与生物的基本代谢过程。RNA的这些功能都与RNA的结构息息相关,因此对RNA二级结构的研究来已成为必然趋势。本文首先对RNA的重要性进行了介绍,从而引出预测RNA二级结构的必要性。为此本文对RNA的概念、类别、功能、表示方式和结构特点等相关知识作了论述,并对目前存在的模型和算法进行了介绍。通过比较分析模型和算法的思想,可以将其分为基于序列比较思想和最小自由能思想的算法,这些算法思想存在着一些不足。对于序列比较思想其在适用上受限于已有序列的先验知识且具有较高的时间和空间复杂度,而最小自由能思想则容易陷入局部最优解,影响预测精度。为此,本文通过综合分析上述算法的问题,提出了一种基于离散Hopfield神经网络的改进算法IA_DHNN,使其适合预测RNA二级结构,并首次将其应用于该领域。该算法以离散Hopfield神经网络为基础,考虑到了Hopfield神经网络的初值敏感性和易陷入局部最优解的缺点,提出了利用免疫算法的记忆性和敏感性优化Hopfield神经网络,扩大Hopfield神经网络解的搜索空间,使其跳出局部最优达到全局最优。同时,在使用免疫优化Hopfield神经网络前,提出使用距离函数初始化免疫算法的抗体的生成,使可能的最优解得到保留,此外还用了k均值聚类算法对生成的抗体进行聚类降低冗余,提高算法的效率,在此过程中为了使该聚类适应于RNA二级结构预测使用了海明距离进行分类和按位与操作求取聚类中心。最后,通过仿真实验,使用IA_DHNN算法对碱基水平和茎区水平上的RNA序列进行测试,并与IA算法、DHNN算法以及RNA Structure软件进行比较,得出结论:(1)对Genomic tRNA Database库中随机选取的序列,IA_DHNN算法从总体预测精度上高于其他算法;(2)IA_DHNN算法正确预测的茎区个数与实际茎区个数基本相同,达到83.3%。从上述结论证明了本文算法的积极作用。
其他文献
随着5G蜂窝网络的快速发展,终端直通通信技术(Device-to-Device communication,D2D)因其高传输速率、高频谱及能量利用率的优势被广泛关注。在合理的功率控制和资源分配方案
数学科目因其自身具有较强逻辑性的特点,成为学生们学习的难点.小学阶段的数学是基础内容,是数学学科学习的启蒙阶段.但因为小学生普遍处在思维发展的初级阶段,理解能力和接
本文以ABA合成缺失突变体(los5-1)和野生型拟南芥(C24)为材料,利用膜片钳技术分析了胞外ABA处理对突变体和相应野生型的保卫细胞质膜内向K+电流的影响,并进一步分析胞内Ca2
植物花器官发育研究是植物发育分子生物学的重要内容。自Coen等人首次提出花器官发育的“ABC”模型以来,花器官发育的研究取得了突破性进展。以拟南芥、金鱼草等模式植物为代表的与花器官发育相关的基因相继被克隆。研究表明,控制花器官发育的绝大部分基因属于MADS-box基因家族成员。该家族成员是一种重要的转录因子,都含有一个保守性很强的MADS盒,最早在酵母(MCM1)、拟南芥((?)GAMOUS)、金
目前,超声成像在疾病的临床诊断和治疗中已经得到了广泛的应用,主要是因为超声成像拥有实时性、可靠性、可重复性、灵敏性和廉价性等多种独特的优势。因此高效、准确无误地分
接触压力和温度信号的采集系统的研究对医疗康复、体育科研等领域都有着重要的意义。系统可以测量和显示接触表面的压力分布和温度分布情况。  本文研究了三种基于导电硅橡
  为了研究HNTX-Ⅳ结构与功能的关系,用芴甲氧羰基(Fomc)固相多肽合成方法合成了用丙氨酸(Ala)替代HNTX-Ⅳ第12位丝氨酸(Ser12)的突变体S12A-HNTX-Ⅳ和替代第29位精氨酸(Arg
  本论文的研究工作选取甘肃省的三个特有少数民族—临夏东乡族、临夏保安族、肃南裕固族,以及临夏回族和天水汉族等五个民族群体共403个无关男性个体为研究对象,进行Y染色体
黄山太平湖于2012年被列入国家第二批水质良好湖泊生态环境保护专项,并于2013年被列入国家生态环境保护专项15个重点支持湖泊之一,太平湖的环境保护工作已升至国家战略。近些年
幼儿音乐欣赏活动在幼儿阶段是为了让孩子更好地走进音乐的天地,但是传统音乐教学的难点是教学手段单一,操作性不强,幼儿难以理解音乐内涵.我们尝试运用多种感官通道共同参与
期刊