【摘 要】
:
RNA的多种功能是由其基本结构决定的,全面且准确的研究RNA基本结构有助于深入理解RNA在分子生物学中的作用,并且促进RNA生物技术领域的发展。确定RNA的碱基配对状态是进行RNA二级结构预测的第一步,近年来利用高通量探测数据来提高热力学模型预测的准确性是RNA结构测定的研究热点。其中,利用引物延伸选择性2?-羟基酰化(SHAPE)实验获得的结构信息,对RNA二级结构预测模型的准确性有很大的提高。
论文部分内容阅读
RNA的多种功能是由其基本结构决定的,全面且准确的研究RNA基本结构有助于深入理解RNA在分子生物学中的作用,并且促进RNA生物技术领域的发展。确定RNA的碱基配对状态是进行RNA二级结构预测的第一步,近年来利用高通量探测数据来提高热力学模型预测的准确性是RNA结构测定的研究热点。其中,利用引物延伸选择性2?-羟基酰化(SHAPE)实验获得的结构信息,对RNA二级结构预测模型的准确性有很大的提高。这种利用软约束来实现将探测数据与基于热力学的RNA二级结构预测算法集成的实验,相当于在RNA二级结构的标准能量模型中加入合适的伪能量项。通过不同的机器学习技术确定RNA序列中哪些核苷酸在RNA二级结构中是成对的或非成对的问题,本文称之为RNA状态推断,成功的RNA序列状态推断算法可以为有数据导向的最小自由能模型预测RNA二级结构提供辅助信息。这些数据可以通过最小自由能模型整合到RNA二级结构预测中,这种方法被称为预测状态定向最小自由能模型(NNTM)。将这些状态预测转换为合成形状数据(Shape-Data),用于指导NNTM,可以大幅提高RNA二级结构预测精度,从而为研究RNA更高级结构、改善RNA结构分析算法和分析RNA-RNA相互间作用提供帮助。本篇论文主要研究了生物信息学中关于RNA二级结构预测的最新的研究方向:利用Shape-Data数据作为NNTM的软约束预测RAN二级结构。在这篇论文中我们分析了三个主要的实验依据,1.利用深度学习模型可以进行RNA状态推断;2.状态推断和Shape-Data数据之间可以通过公式进行转换;3.Shape-Data数据拟合结果越好,对NNTM预测RNA二级结构就越准确。根据上述三个研究分析和本文的实验证明,Transformer模型在RNAStralign数据集进行状态推断能够取得优异的表现。本篇论文的实验利用Transformer模型在RNAStralign数据集进行状态推断并通过ACC、PPV、SEN三个指标去评价模型在RNA状态推断上的表现,三项指标均取得90%以上的良好结果,这些实验结果说明利用Transformer模型的多头注意力机制可以很好的学习到RNAStralign数据集上RNA序列之间的关系。尤其是RNAStralign数据集包含了八个家族的RNA序列,序列中长的序列可以包含上千个核苷酸,短的甚至不到一百个核苷酸,能够在RNA序列如此分散的数据集上取得这样的表现,这完全可以证明利用Transformer模型进行状态推断是一个正确的选择,同时证明,寻找一个更佳的模型预测Shape-Data数据,作为软约束在NNTM模型中预测RNA二级结构是一个十分可行的研究方向。
其他文献
随着网络的发展及多方面的需求,卫生职业学院学生(以下简称卫职院校学生)中上网已经成为一种普遍现象。对于卫职院校学生来说,其人生观、价值观尚未真正定型,因此上网过程中难免会存在一些不利于其健康成长的现象。本文在研究过程中就当前卫职院校学生网络生活现状及其管理情况进行了分析,并基于网络生活角度对卫职院校学生管理提出了几点建议。
猪流行性腹泻(Porcine Epidemic Diarrhea;PED)的病原体是猪流行性腹泻病毒(Porcine Epidemic Diarrhea Virus;PEDV),该病具有传播快、流行性广和仔猪致死率高等特点[1]。PED的暴发和流行已给我国乃至全球的养猪业造成毁灭性的打击。目前针对该疾病的主要的防治手段为口服/肌肉注射疫苗、病料反饲等,效果仍然有限。因此,急需开发出新型的病毒防治策
路径规划是人工智能领域的一个重要研究方向,一个好的路径规划算法需要满足两个基本的要素:第一,算法应规划出一条能在飞行过程中绕过障碍物的路径;第二,算法规划出的路径应该是最佳路径,并满足所涉及的各种约束。然而,传统的路径规划算法把所涉及的约束固化在程序中,不方便修改、添加新的约束,因此,本文采用XCSP3语言对路径规划过程中所涉及的约束进行表示,从而实现约束的可动态修改与删除。*算法是一种经典的启发
针对目前高品质番茄价格昂贵,大众需求无法满足的问题,根据番茄对水分和氮素营养的需求规律,研究高粱伴生以及植株生长发育的某个阶段水分胁迫对番茄品质的影响。本试验以品种“铁皮”和“普罗旺斯”为研究对象开展试验,通过盆栽试验研究栽培措施对果实糖酸含量的影响,在此基础上探究水分胁迫和高粱伴生对番茄糖代谢、植株生理特性及土壤微生物的影响。揭示水分胁迫和高粱伴生模式下果实糖代谢、植株生理代谢以及土壤微生物的变
长非编码RNA(long non-codingRNA,lncRNA)是一种长度超过200个核苷酸,且不翻译蛋白质的RNA。近年来,越来越多的研究揭示lncRNA在生理和病理过程中起着重要的调控作用。lncRNA的异常表达与许多严重危害人类健康的重大疾病(心脑血管、阿尔兹海默和癌症等)有着密切的关联。lncRNA的研究成为近年来新的研究热点。随着lncRNA的生物医学文本爆炸式增长,自动探索和挖掘海
酸性土壤中的低pH环境和Al胁迫会对植物造成侵害,二者均会抑制根的伸长。植物耐低pH和Al胁迫机制已经是近年来的热点课题,但是相比对金属离子Al的研究,低pH对植物的影响还没有较深入的研究。本文从TMT标记的定量蛋白组和转录组学联合分析的角度研究拟南芥在低pH条件下的蛋白表达变化和基因表达变化,鉴定和筛选出低pH响应基因和蛋白,同时通过基因克隆和转化的方法将组学中发现的重要低pH相关基因与LUC串
目的:探讨高职院校护理人际沟通中应用学生标准化病人的效果。方法:将高职院校护理专业60例学生(2019年2月到2019年6月)按随机数表法分为常规组(n=30,常规护理人际沟通教学)和标准化组(n=30,学生标准化病人辅助),分析学生人际沟通能力状况。结果:标准化组学生沟通基础知识掌握、案例分析、沟通技巧、情感支持评分显著高于常规组(P<0. 05)。结论:高职院校护理人际沟通中运用学生标准化病人
选择20头体质量500kg左右的西门塔尔杂交牛进行试验,研究肉牛宰前运输应激对其血液理化指标及免疫机能的影响。结果表明:与运输前相比,运输后体质量极显著降低(P<0.01),体温极显著升高(P<0.01);血清谷草转氨酶(P<0.01)、肌酸激酶(P<0.05)、乳酸脱氢酶(P<0.05)和碱性磷酸酶(P<0.05)水平均显著升高;血清葡萄糖(P<0.01)和乳酸(P<0.05)含量显著升高;尿素
精确的RNA二级结构信息是基因功能研究和RNA三级结构预测的基石。RNA是生物体内重要的基本物质。它在调节基因和表达基因中起重要作用。RNA在生物中的功能主要取决于其三级结构。然而,RNA分子的三级结构很复杂,缺乏有效的描述方法。从RNA分子的一级结构直接预测三级结构非常困难。因此,使用RNA的一级结构去预测RNA的二级结构成为研究RNA结构的主要过程。同时含假结的RNA二级结构的研究一直是RNA
随着经济的快速发展,我国公路货运量以及货物周转量逐年上升,商用车销售量以及保有量逐年增加,公路运输的能源消耗问题逐渐变得不可忽视。因此,针对商用车的节能控制研究具有重要的意义。通过车辆无线通讯技术获取实时行车环境信息进行预测性分析决策,实现对车辆状态的自主调整,将有效提高商用车节能控制策略的适应性与控制效果,对降低车辆能耗具有重要的作用。针对商用车公路运输的行驶特点,本文依托吉林省教育厅科学技术项