RNA编码潜能的理论研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:JK0803_gengjixiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类基因组里面大约有2%的序列被转录成mRNA,其中很大部分以前认为是“垃圾”的序列也会被转录成非编码RNA(ncRNA)。从成千上万序列中寻觅基因,生物信息学领域发展了很多成熟的算法,它们在基因预测方面也取得了令人鼓舞的结果。然而,随着研究的不断发展,研究人员发现一些ncRNA实际上是能编码的mRNA,它们包含一些较短开放阅读框(short ORFs,sORFs)。之前大多数寻找mRNA的生物信息学算法限于300个核苷酸以上。这一缺陷导致经典的基因注释软件对一些包含sORF的“长非编码RNA(long ncRNA,lncRNA)”进行了错误分类。于是,我们提出了一种基于支持向量机(Support Vector Machine,SVM)分类器的编码潜能预测方法(CPPred),该方法使用了多个特征,其中包括由全局描述编码的新RNA特征。CPPred不仅可以更好地区分编码RNA和ncRNA,还可以区分短的编码RNA和短的ncRNA。研究表明,全局描述编码特征(T2,C0和GC)在编码潜能的预测中起重要作用,其可以捕获RNA折叠结构特征。CPPred在人类,小鼠,斑马鱼和酿酒酵母测试集上,具有高的准确性。在这些物种的测试集上,CPPred的准确性较之前发表的工具有所提高。而CPPred在这些物种的短的RNA(sORF)测试集上展现出特别的优势,比之前开发的工具有一个比较大的提升。在CPPred的基础上,我们增加了两个特征,并使用了Non-AUG作为起始密码子,开发了CPPred-sORF,对sORF做了全面的评估。CPPred-sORF构建了短的编码RNA和lncRNA分别作为阳性数据和阴性数据。相比于都是短的编码RNA和ncRNA的识别,lncRNA和短的编码RNA是更不容易区分的,这是因为序列越长那么它们更容易包含开放阅读框。经测试,CPPred-sORF在独立测试集上的灵敏度、特异性和马修相关系数(MCC)值分别为88.22%,88.84%和0.768,比其他方法的预测性能提升了不少。此外,我们开发了CircPred,用于区分环状RNA(circRNA)和编码RNA,以及区分circRNA和lncRNA。该工具在CPPred特征的基础上,添加了和剪接相关的AT-GT信号特征,因为它与circRNA密切相关。我们构建了非冗余的circRNA,编码RNA和lncRNA数据集。在circRNA和lncRNA预测中,CircPred得到的灵敏度、特异性和MCC值分别为85.17%,96.56%和0.833。在circRNA和编码RNA的预测中,CircPred的灵敏度、特异性和MCC值分别为65.58%,98.75%和0.739,比其他预测编码潜能的工具都有所提升。
其他文献
随着我国隧道工程建设的迅猛发展,隧道施工中越来越多地遭遇由不良地层导致的地质灾害,严重威胁着施工人员与设备的安全。隧道超前探测技术能够提前探明前方的地质类型,揭示即将到来的不良地层,是提高施工安全性的有力保障。然而,现有的超前探测技术多面向钻爆法施工隧道,不适用于全断面岩石隧道掘进机(Tunnel boring machine,TBM)工法。且与钻爆法的循环爆破不同,TBM的开挖进程是连续的,在掘
水安全关乎全人类的未来,如何应对日益严峻的水污染问题受到了全球范围内的广泛关注。研究表明,非晶合金因其无序结构、亚稳特性等特点而展示出高效降解偶氮染料等有机污染物的催化性能。然而,因制备工艺的限制,目前常用的非晶合金催化剂多为粉末和条带,存在比表面积小,催化剂回收困难等弊端。激光选区熔化(SLM)3D打印技术是近年来发展起来的一种增材制造技术,能够成形任意复杂形状和多孔结构的非晶合金催化剂。本文通
水下平台温盐深剖面仪(CTD,Conductivity-Temperature-Depth Profiler),是一种基于水下观测平台对海水温盐深水文信息变化进行长期连续观测的剖面仪。CTD作为海洋的“感官”,利用其获取的深度、温度和电导率可衍生出海水的盐度、密度和声速等能反映出海洋物理特性的重要参数,为海洋探索和科学研究提供了最基本的前提条件。鉴于我国现有支撑观测系统建设和创新研究对CTD的性能
波浪是一种复杂的海洋水文现象,对海上运输和海岸工程的安全有着直接影响,波浪的观测有着深远的现实意义。在诸多波浪观测仪器中,测波浮标有着可以长时间自动测量、布放位置自由、成本低、精度高的优点,目前是最主要的测波仪器。国内已经有相对成熟的波浪浮标,但均只输出统计特征值,没有波浪谱特征估计功能。波浪方向谱能够直观体现能量在频域和方位上的分布,给出波浪的内部构造,展示出其中风浪与涌浪的信息,同时谱特征值也
结构在服役过程中,由于外部荷载、服役环境和材料内部因素的共同作用,其强度、承载能力、可靠度等随时间逐渐降低,严重威胁其安全有效服役。可靠度是衡量结构安全程度的重要指标,因此对服役期间的结构进行时变可靠度分析,以及据此对其进行恰当的维修是十分重要的课题。不同的维修策略,包括维修次数、维修时间以及维修方式,对应于不同的结构性能改善以及费用。因此,确定结构在服役过程中的最佳维修策略对其安全性和经济性的平
个人信息权益的性质一直存在比较明显的争议,所以《中华人民共和国民法典》(以下简称《民法典》)当中并没有使用"个人信息权"的表述。依据《民法典》中的相关个人信息保护规定可以明确自然人对其个人信息享有的是作为民事权益的人格权益,其并不属于公法的权利。自然人个人的信息权益可以涵盖以及保护其所享有的人格利益以及经济利益,对于作为财产权的个人信息权益也不需要再确认。根据我国法律可以了解到,自然人就其个人所享
钠离子通道是镶嵌在细胞膜上的将钠离子由细胞外转运到细胞内的大分子跨膜蛋白。钠离子通道在动作电位产生的去极化过程中有重要作用,主要分布在肌肉细胞、神经元、神经胶质细胞中。根据启动方式的不同,钠离子通道可以分为电压门控型和配体门控型。心脏钠离子通道属于电压门控型通道,参与心肌细胞动作电位的产生和传导过程。心脏钠离子通道是一个蛋白复合物,其核心部分为α亚基,而β亚基及其它调节蛋白也是钠通道蛋白复合物的重
由于高能粒子引起的级联碰撞作用,核反应堆中的压力容器与核燃料包壳在材料内部将会产生大量的空位与间隙原子点缺陷对。空位在多物理场(包括温度场、应力场、化学浓度场)环境下将逐渐聚集、演化为各种不同类型的空位型辐照缺陷。实验证据表明:辐照硬化、脆化、蠕变等材料辐照效应与空位型缺陷和材料的塑性变形载体的相互作用密切相关。空位型缺陷处于微米、纳米甚至是亚纳米量级,仅依靠单纯的实验方法无法全面地认识和理解由“
海水温度盐度是海洋动力环境要素中最重要的两大要素,海水温度盐度的测量对海洋资源开发、利用以及军事国防等方面都具有重要的意义。未来海洋观测技术智能化、网络化发展趋势,使海洋传感器技术不断向小型化、低成本化的方向发展。现有传统电导率和温度传感器存在着成本高,无法实现大批量制造时保证高一致性的问题,制约着其在海水养殖、海洋环境监测等领域的大范围推广应用。本课题从测量原理出发,通过理论分析及有限元仿真分析
重力梯度仪在惯性导航、重力场恢复、资源地质勘探等领域有着广泛的应用。重力梯度仪从测量原理上来分主要有两大类:一类是基于差分加速度计测量模式,另一类是基于扭矩测量模式。前者响应较快但整个系统的复杂程度高,需要读取加速度计对中的每一个加速度计的输出然后进行差分,这对加速度计的动态范围以及配对的共模抑制都提出了很高的要求;而后者直接得到力矩的差分结果,因而不存在先读取两个输出再进行差分的问题,但系统响应