N6-腺苷酸甲基化修饰位点的计算模型研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:gksword
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
N6-腺苷酸甲基化(m6A)修饰是一种既存在于RNA中,又存在于DNA中的甲基化修饰。在已知的150多种RNA转录后修饰中,N6-腺苷酸甲基化修饰是最具有代表性的一种修饰,广泛存在于m RNA和长链非编码RNA中,可在转录水平调控RNA翻译、切割、转运和定位。同时,N6-腺苷酸甲基化修饰作为一种非典型的DNA修饰,与DNA复制、转录、修复等一系列生物过程也密切相关。通过构建计算模型来进一步揭示m6A修饰的内在规律,促进m6A修饰的研究进展。本文通过结合多种特征提取技术设计了双层集成学习策略,并融合机器学习方法和深度神经网络,对N6-腺苷酸甲基化修饰位点识别的计算模型进行研究。具体研究内容如下:(1)利用传统的机器学习方法,提出基于双层集成学习策略的TL-Methy模型来预测m6A修饰位点。该模型基于不同特征提取技术将样本序列转换为多个不同的数值向量特征,基于得到的数值向量特征训练多个支持向量机(SVM)模型作为TL-Methy模型第一层的基分类器;以第一层基分类器的输出结果作为TL-Methy模型第二层的输入特征向量,采用刀切测试和10折交叉验证对TL-Methy模型进行性能评估,以此确定最优分类器作为TL-Methy模型第二层的预测分类器,并通过对比实验分析TL-Methy模型的预测性能。(2)采用深度神经网络,提出以CNN为基础网络框架,结合双向LSTM的预测模型。以拟南芥转录组中的m6A修饰位点数据集为实验数据,提取传统手工特征向量、离散特征向量和混合特征向量,并基于三种模式的特征向量分别训练三组CNN网络和SVM模型,对其在m6A修饰位点识别上的应用进行比较分析,并根据两种集成学习策略,分别构建了采用CNN网络与SVM模型的双层集成模型和仅采用SVM模型的双层集成模型,进一步对其在不同集成学习策略下的应用进行分析比较。对所提出的模型采用10折交叉验证进行性能评估与比较。
其他文献
系统的稳定性是控制系统的基本要求。稳定性分析为控制理论应用于实际系统奠定理论基础。实践应用过程中,人为操作不当、外部干扰、系统参数的时变等诸多不确定因素以及脉冲干扰等不利于维持系统的稳定性,甚至降低原系统的良好性能。因此对影响系统稳定性的因素,进行研究具有重要意义。本文主要内容如下:(1)针对不确定脉冲随机系统在强结构不确定性的情况下的稳定性问题,利用Lyapunov函数和经典的矢量不等式,首先,
学位
几何演化问题是发展方程在微分方程和几何学中的交叉,演化过程产生的方程广泛应用于工业、材料科学、计算机视觉、图像处理、物理学和基础数学中产生的数学和物理问题。本文主要讨论平面凸曲线和非简单曲线的演化问题。对平面凸曲线,提出各向异性的对数型曲线流和保长度曲线流两个模型;对非简单曲线,给出一个保长度曲线流模型。对各向异性的对数型曲线流,证明在该流下,演化曲线长时间存在且保持凸性,同时收敛到与一条给定光滑
学位
深度神经网络在机器学习领域受到越来越多的关注。作为无监督学习的代表,生成对抗网络(GAN)在深度学习方面占据了重要位置,从而衍生了一系列改进的GAN模型。但改进的GAN模型往往存在参数量大、计算复杂度高、存储空间大等问题,从而在实际应用中受到限制。本文在精简网络模型,加快模型运行速度方面做了相应的优化研究。本文针对深层判别网络进行模型剪枝,主要有以下几方面的研究成果:(1)首次将组Lasso稀疏网
学位
图像作为人类传输和获取信息的主要载体,能更加准确、方便获取图像信息是非常关键的,因此有必要对图像进行预先处理。图像分割是图像处理的重要组成部分,对后续的分析图像有着至关重要的作用,被广泛应用于人脸识别、医学影像、智能交通等领域。基于水平集方法的图像分割由于独特的优势,成为不少学者的研究热点。它具有能处理复杂的拓扑结构、数值求解容易实现且有较强的数学理论支撑等优点,使其成功应用到各行各业当中。同时,
学位
图论是一门历史悠久但与时俱进的数学学科.图的控制理论作为图论的一个重要研究方向,在实际问题中应用非常广泛.克罗内克乘积图和笛卡尔乘积图是两类常见的乘积图,它们规模大、结构复杂.确定这两类乘积图的控制数是NP-困难问题.图的3-彩虹控制是有3种颜色的彩虹控制,其定义为:在图G=(V,E)中,函数f:V→{1,2,3}为3-彩虹控制函数(3RDF),当且仅当V中每一个满足f(v)=(?)的顶点v都有U
学位
不平衡数据分类算法对于捕获数据的偏斜信息及挖掘少数类样本的潜在价值具有重要意义。现有不平衡数据分类算法大多针对二分类问题而无法满足多分类需求,在实际分类任务中具有局限性。本文针对多类不平衡数据分类问题,在验证融合分类器动态选择策略的不平衡数据分类方法有效性的基础上,以粗糙集约简算法、重采样技术为基本工具,借助动态集成分类策略,构建满足多分类需求的动态集成分类方法,力求实现对少数类样本的有效预测。主
学位
出口供应链不确定性是阻碍我国出口增长的关键因素,本文旨在研究企业数字化转型对出口供应链不确定性的缓解作用。首先引入数字化参数和不确定性参数,构建出口供应链选择模型,理论探讨了企业数字化转型影响出口供应链不确定性的效果和原因;并基于对企业产品层面出口供应链不确定性的测度,对理论命题进行了检验。研究发现:(1)企业数字化转型相比未转型企业显著降低了出口供应链不确定性,凸显了数字化转型对出口供应链的“稳
期刊
稀土离子掺杂荧光粉在固态照明、液晶显示和太阳能电池等领域具有广泛应用。在固态照明领域,稀土离子掺杂荧光粉主要应用于白光发光二极管(LED),荧光粉转换法是合成白光LED的重要方法,其可通过蓝光LED激发黄色荧光粉或近紫外光激发三基色荧光粉实现白光输出。红色荧光粉的特性对白光LED的显色性能具有重要影响,相比于蓝、绿色荧光粉,红色荧光粉的性能还较差,其被近紫外光激发的效率也较低,因此,研发可被近紫外
学位
图的控制理论是图论领域中的一个重要研究分支,并在实际生活中应用广泛。由于与实际问题紧密相连,学者对图的各种控制参数进行了大量研究,根据不同实际背景提出了很多种不同的控制类型。本文研究的是含圈笛卡尔乘积图的3-彩虹控制数。确定图的3-彩虹控制数是NP-完全问题。笛卡尔乘积图是大规模网络拓扑结构图,在实际中应用广泛。因此,确定笛卡尔乘积图的3-彩虹控制数的精确值或者给出控制数较好的界具有理论意义和实用
学位
随着互联网技术的发展和普及,第三方交易平台在交易中变得越来越重要,它为满足人们随时随地的实现买卖交易行为提供了可能性,但由于网络的虚拟性等因素的影响,导致电子商务违法行为在平台的发展过程中也逐渐产生,这就使得第三方交易平台成为了众多网络交易违法行为发生的密集区。因而,在电商不断迅猛发展的势头之下,政府部门应该如何解决这一问题,形成有效的监管体系,是一个值得我们进一步研究和亟待解决的问题。为此,本文
学位