非编码RNA相关计算问题研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:caisilver
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非编码RNA(non-coding RNAs ,ncRNA)是指不编码蛋白质的那部分转录产物,在各种生命过程中发挥着重要作用,包括基因调控、染色体重塑、基因定位、基因修饰和DNA印记等。对ncRNA的研究不仅具有重要的理论和应用价值,而且将对人们探索生命本质问题提供不可或缺的工具。由于采用实验方法研究ncRNA的各类问题,通常代价高、耗时长,且盲目性强。而随着各种生物基因组测序的先后完成,以及相应各类数据库的建立和不断丰富完善,使得计算方法在ncRNA各类研究中的应用成为可能和必要。本文选择了和ncRNA相关的序列-结构比对、二级结构预测和ncRNA基因识别等经典计算问题为研究课题,采用模式分类中的各种方法展开了深入研究,论文的主要研究内容和创新点包括以下几个方面:1、ncRNA序列-结构比对研究。序列比对是计算分子生物学的经典课题,而ncRNA因为其结构保守性比序列保守性更强,使得用传统的序列比对程序得到的结果不能满足各种ncRNA相关分析的需要。为此,要在序列比对的同时更多的考虑ncRNA的结构信息,这成倍的增加了算法复杂度。本文将量子遗传算法引入ncRNA序列-结构比对中,充分利用量子编码的叠加性、种群的多样性和量子旋转门进化的并行性,结合传统遗传算法的突变和交叉操作,提出了一种兼顾了结构和序列信息的全干扰配对保守交叉算子,并定义了充分考虑结构和序列信息的优化目标函数,使得进化速度和对局部最优沦陷的控制达到了较理想的结果,和传统遗传算法相比,缩短了优化过程的时间,提高了比对质量。2、ncRNA二级结构预测研究。遵循“结构决定功能”的ncRNA基因,二级结构在其各种相关研究中起着重要作用。传统的ncRNA二级结构预测方法都是基于优化算法,计算复杂度较高,时效性差。本文将ncRNA二级结构预测问题视为分类问题,重点研究了给定序列比对的情况下,根据序列比对提供的各种信息,判断比对的任一列对是否能够形成碱基对。在总结了现有结构预测算法中采用的各种数值计算量后,运用特征选择技术的不同方法对各种数值计算量进行了定量分析(以往预测方法都只进行了定性分析),并选出了适于分类算法进行结构预测的特征子集,此最优特征子集结合了热力学信息(平均碱基对配对矩阵)、共变信息(包含碱基对堆积的共变分值)和进化信息(Akmaev采用的整合序列间进化关系的R统计量)。采用SVM分类器及所选特征,结合茎组合规则,给出了基于分类算法的ncRNA二级结构预测方法,为结构预测提供了新的思路。3、microRNA基因前体识别。各类ncRNA基因由于不具备传统基因的识别特征,且在基因组中分布广泛、类别多样、长短不一,使得通用ncRNA基因识别方法效果不佳。microRNA作为一类重要的调控RNA,在许多生命过程中发挥着重要的作用,而microRNA前体(pre-miRNA)识别则是进行相关分析的前提步骤。虽然发卡二级结构是pre-miRNA的一个显著特征,但基因组中存在大量能折叠成发卡结构的非pre-miRNA序列。本文围绕pre-miRNA发卡二级结构特征,研究了如何从具有相似结构特征的序列中识别出pre-miRNA的问题。首先,通过将RNA二级结构“拉伸”,我们提出了一种新的局部序列结构特征,新特征不仅包含了发卡结构中茎结构序列信息,还考虑了凸环和内环的信息。测试显示,这些新的局部序列结构特征的分类表现要优于同类的3SVM特征。然后,为详细刻画pre-miRNA发卡二级结构信息,我们将图论和计算化学中的拓扑指数相结合,构造了新的自由能权重图拓扑指数特征。通过对这些拓扑指数的统计分析,以及和其他现有pre-miRNA识别特征的综合比较,显示了新的拓扑指数特征,不仅能够很好的刻画出pre-miRNA发卡结构中各元件的拓扑关系,而且通过自由能权重体现了结构中碱基组成及其相对位置。最后,通过特征选择技术,我们从包括了4种拓扑指数特征的52个候选特征中,选出了适合于pre-miRNA识别的23个全局特征子集,并通过对类不平衡数据的有效处理,得到了一个性能较好的pre-miRNA识别模型。
其他文献
拓扑学中关于连续矢量丛有一套经典的障碍理论([1]).与此相对应的代数障碍理论则最早于上世纪90年代由Nori提出([2],[3]).对于无限域k上的光滑代数簇X =Spec(A), dim(A) = d≥2, Nori构造了代数障碍类群E(A).进一步的,对于秩为d的投射A?模P和定向χ: A≌∧dP, Nori定义了障碍类e(P,χ)∈E(A).随后,这些定义被S.M.Bhatwadekar和
五味子,皮肉甘酸,核中辛苦,都有咸味,故有此药名。不!我说的不是中药材,而是五位好兄弟,是与阳州市医院有瓜葛的酸、甜、苦、辣、咸味子,这人生百味都凑到一起,如果不是缘分,就只能说是气味相投了。咸味子,如盐。俗话说得好,咸鲜淡没味儿。饭菜鲜不鲜,就看一把盐。确实如此。
期刊
近年来,MnBi合金作为一种新型的无稀土高性能永磁材料受到广泛关注。MnBi合金是稀土永磁在中高温环境下的潜在替代材料,因为它不仅具有较高的內禀矫顽力和良好的饱和磁化强度及磁能积,而且矫顽力在一定温度范围内具有正温度系数和磁光特性。但是在制备MnBi合金时,Mn与MnBi液相很容易在包晶反应过程中发生分离,难以获得纯低温MnBi相合金。因此实验结果与MnBi理论性能之间仍存在较大差距。元素掺杂被认
随着光纤传感器在各种领域中的迅速发展,不同类型管道内的流体流速测量方法也在不断变革。本文针对微型圆管道内的流体流速测量进行了研究:1、概括分析了几种干涉型光纤传感器的基本原理,并举例介绍了它们在流体流速测量领域中的典型应用,为所提出的干涉型光纤流速传感器提供理论基础。2、提出并设计了一种基于法布里珀罗(Fabry-Perot,FP)干涉原理的流速测量传感器,利用单模光纤(Single Mode F
发光调控是稀土发光材料应用非常重要的课题之一,传统的方法是将稀土离子掺杂在不同的基质材料中。研究人员在不同的寄主或配体环境中研究发光中心的发光调控及其机制。其中,寄主材料的晶格对称性是影响发光材料光学性质的重要因素之一。利用稀土离子的辐射跃迁对于周围晶体场环境的敏感性,若采用物理和化学方法降低发光中心周围的晶体场对称性,那么也可以改变发光材料的光学性质。许多方案可以通过改变晶体场结构的对称性,实现
钙钛矿型氧化物ABO3是强关联的电子体系,有着复杂的电子结构,涉及金属-绝缘体转变、电子和磁性相分离等许多凝聚态物理学问题。在这类氧化物中,Mn、Fe基稀土氧化物因为其丰富的磁、光等卓越的物理化学性质和相应效应而成为当前功能材料和凝聚态物理领域的研究热点之一。本文在文献调研的基础上设计了可行的溶液法制备氧化物薄膜:Mn2O3、Nd2O3、Sm2O3和Sm Mn O3、Sm Fe O3和Nd0.8S
现代学徒制教学模式是高职院校发展的重要方向,在此背景下,为以培养“德技双修”的新时代职业人才为目标的高职院校课程思政教育带来了新的机遇与挑战。从顶层设计引领“双主体”育人的协同联动机制;整合课程教学资源,优化课程思政教学内容;创新课程思政育人方法;构建课程思政“双师型”队伍建设体系;统一评价标准,构建校企协同考核评价体系;打造课程思政协同育人信息化平台等方面提出现代学徒制下的高职课程思政发展策略,
微创介入手术因为其伤口小,出血少、安全可靠、手术时间相对短、恢复快和成本低等优势,越来越广泛应用于心血管病疾的治疗中。但是目前主动导管姿态大多由X射线成像显示,显示二维或三维图像。目前光纤光栅检测技术广泛地应用于桥梁检测、大坝安全检测和煤矿安全检测等,但是对于主动导管三维姿态的光纤光栅检测技术还有待进一步的开发和研究。本文就基于光纤光栅的主动导管三维姿态检测技术研究做了以下具体工作:1.介绍了本文
本文综述了F-P理论、发展历程,介绍各种光纤F-P的制作方法及F-P信号的调制和解调,并阐述了光纤内置反射镜的制作及其传感性能,在此基础上提出了三种基于F-P组合结构的传感器。(1)光纤内置反射镜构成的单个F-P传感器对温度和应变不够灵敏,游标效应能有效提高传感器灵敏度,本实验利用飞秒激光加工平台能相对精准控制F-P腔长的特点,避免了以往切割光纤后再熔接导致F-P腔的塌陷或变形,制作了两个F-P级
近年来为了提高农作物的质量和产量,农药被大量使用,然而不规范的农药使用会导致农作物及环境中的农药残留超标。农产品中的农药残留已经成为一个巨大的健康风险,因此如何准确检测农药的残留量已成为人们的关注点。传统的农药检测方法存在样本预处理复杂、操作繁琐、耗时长等缺点。太赫兹光谱因为高透性、低能性和指纹谱明显等优点在农药检测领域具有极大的应用潜力。与传统的农药残留检测不同的是,在本文中,我们利用太赫兹频域