基于深度学习的植物miRNA靶基因预测研究

来源 :山东农业大学 | 被引量 : 0次 | 上传用户:c0128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物体内存在着种类和功能各异的RNA,其中非编码RNA是近年来新发现的一类RNA,它们在生物体的生命过程中主要起调控作用,而miRNA就是非编码RNA中最有代表性的一类。在植物中,miRNA可以通过碱基互补匹配的方式与靶基因相互识别,并以此对靶基因介导翻译抑制或对靶基因进行切割,进而影响基因性状的表达。基于miRNA及其靶向机制对生物体的重要作用,本文通过研究植物miRNA和靶基因的生物特性,采用深度学习的算法,设计了一种植物miRNA靶基因预测模型:DeepMiRNA,并开发了基于web的植物miRNA靶基因预测系统。自miRNA被发现,miRNA的相关数据量在不断攀升,对miRNA靶基因的预测也从传统的单一靶基因序列验证转变为借助计算机技术中的大数据和机器学习、深度学习等技术进行预测。并且由于一个miRNA一般会有多个靶基因,因此计算方法的产生极大的推动了miRNA靶基因预测的效率和准确性。因此基于当前的研究现状,本文利用在序列类自然语言处理中有出色表现的卷积神经网络(CNN)和循环神经网络的特殊形式双向长短期记忆网络(BiLSTM),设计出针对植物miRNA靶基因的预测模型DeepMiRNA。在数据的选择上,本文选择了拟南芥、大豆和水稻三种植物miRNA数据,并将三类植物数据进行混合产生混合数据。对数据的处理中包括对原始基因数据的碱基替换、序列补齐、数据编码等过程,从而将原始基因数据转换为可以输入模型的数据结构。经过模型的训练和测试实验,结果表明DeepMiRNA模型在基于拟南芥的数据中可以达到93%左右的准确率;在基于大豆的数据中可以达到89%左右的准确率;在基于水稻的数据中可以达到91%左右的准确率;在基于混合的数据中可以达到90%左右的准确率。在与其他分类算法进行对比后,显示DeepMiRNA模型在植物miRNA靶基因的预测问题上表现优异,预测结果优于对比的其他算法,表明本模型可以实现对该问题较好地进行分类。为进一步推进DeepMiRNA模型在植物miRNA靶基因预测上的应用,本文开发了植物miRNA靶基因预测系统,使用者可以使用该系统进行在线的靶基因预测并获得预测结果(http://www.deepbiology.cn/deepmi/)。
其他文献
改革开放40年来,我国不断深化同世界其他国家的贸易往来,服务贸易相较于货物贸易呈现出后来者居上的姿态,其中生产性服务贸易成为服务贸易发展的必然趋势。一国开展生产性服务贸易,不仅有利于该国生产性服务业的高速增长,还有益于服务贸易结构的整体优化。目前中国生产性服务贸易处在高速增长阶段,进出口总额增长较快,近年来在服务贸易总额当中所占比重均超过50%,但存在部门贸易不均衡、贸易竞争力弱等问题,因此有必要
目的研究益脑胶囊对小鼠脑组织蛋白含量及脑组织胆碱酯酶(CHE)活性的影响,探讨其益智作用机理。方法以脑灵素胶囊及哈伯因石杉碱甲片为阳性对照药,用双缩脲法提取脑组织的CHE及蛋
在汽车能源与环境问题日益突出的当下,基于我国缺油、少气、多煤的能源结构,发展汽车代用燃料,实现汽车能源多元化对于摆脱对不可再生石油燃料的依赖、实现交通能源转型升级、保障能源安全至关重要。煤基合成柴油作为优质的高效清洁石油替代燃料,生产工艺愈发成熟,应用于内燃机方面前景优良。本文针对试验所用的煤基合成柴油,提出了对应的模型燃料,并基于模型燃料构建了相应的化学反应动力学机理,进而将机理与三维仿真模型耦
【目的】向日葵白锈病、黑茎病是2种危害严重的新入侵病害,新疆地区新源县和特克斯县为这2种病害发生区。研究目前种植的油用型向日葵品种对向日葵白锈病和黑茎病的抗性差异,
作为出版系统中的重要部分,编辑的主体地位和主体意识日益得到强化。当前激烈的出版行业竞争,要求编辑增强政治意识、学术意识、创新意识、策划意识、读者意识、审美意识,以更好
【背景】转基因作物花粉在大气中扩散会引起基因漂流,从而可导致不可预知的环境风险,运用模型预测可评估其花粉扩散状况、定量确定可靠的安全扩散距离。为了应用高斯烟羽模型