植物miRNA与lncRNA互作关系预测研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:shanqishuai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微小RNA(microRNA,miRNA)和长非编码RNA(long non-coding RNA,lncRNA)在调控内源基因表达、转录翻译后修饰、表观遗传等方面发挥着重要的作用。miRNA和lncRNA还能够相互作用影响各种生命活动,因此越发受到关注。分子生物学实验能够鉴定miRNA与lncRNA互作关系,但其周期长且费用高。计算方法可以预测潜在的互作关系,为分子生物学实验筛选出有价值的数据,从而节省大量时间和费用。现有的相关研究主要针对动物,而很少关注植物。由于动物和植物核酸结构及序列的差异,用于动物数据的预测方法在植物数据上并不可靠。目前依然缺少植物miRNA与lncRNA互作关系数据库和可靠的预测方法,且它们的许多功能都还未知。本文使用机器学习技术预测植物miRNA与lncRNA互作关系,并进一步预测它们的功能。这为生物学研究和植物数据库的建立提供了有力的支持,进而对基因编辑、生物制药、食品加工等技术的进步和广泛应用具有重要意义。鉴于现有的植物miRNA与lncRNA相互作用数据和预测方法有限,构建了可靠的数据集,并对基于监督学习的预测流程进行了研究。阐述了特征提取,序列编码,传统机器学习模型的训练,深度学习模型的设计和训练,集成学习技术以及基于组合模型和模糊决策的预测方法Pmli Pred的实现。实验结果表明,Pmli Pred比现有的预测方法具有更好的性能,通过分子生物学实验从Pmli Pred的预测结果中成功鉴定出新的植物miRNA与lncRNA相互作用。该研究给出了植物miRNA与lncRNA互作数据集的构建方法,又以Pmli Pred为例给出了植物miRNA与lncRNA互作关系的预测流程。该研究是开展创新性工作的初步尝试,在其基础上又分别针对三个重要问题进行了研究。(1)针对植物miRNA与lncRNA互作特征缺少有效的表示方法问题,提出了基于信息强化的互作特征表示方法RNAI-FRID。从miRNA和lncRNA分子中分别提取多样化的基础特征,获得更多的样本信息。通过算术级方法构造复杂特征,在保持分子的特征间关系的同时大幅度降低特征向量维度。由于降维可能导致样本信息损失,在复杂特征构造中使用算术平均策略进一步强化样本信息。综合基于随机森林、极限树和Gradient Boosting的三种特征排序方法,自适应地进行特征选择。实验结果表明,RNAI-FRID是一种有效的植物miRNA与lncRNA互作特征表示方法,有利于训练性能更好的模型。(2)针对植物miRNA与lncRNA互作关系预测模型训练时样本信息不足,集成时无法发挥个体学习器特点的问题,提出了基于多级信息强化和贪婪模糊决策的集成深度学习模型Pmli PEMG。采用融合复杂特征、多尺度卷积长短记忆网络和注意力机制分别从特征级、尺度级和模型级强化样本信息,得到多样化的个体学习器。基于贪婪模糊决策集成个体学习器的输出,发挥它们的特点,得到最终的预测结果。实验验证了多级信息强化和贪婪模糊决策集成方法的效果,表明Pmli PEMG能够跨物种预测植物miRNA与lncRNA互作关系,比目前先进的预测方法具有更好的性能。(3)针对植物miRNA与lncRNA相互作用已知功能少且鉴定成本高的问题,结合集成剪枝和生物技术构建调控网络进行功能预测。首先设计双路并行集成剪枝模型DPEP以获得miRNA与lncRNA相互作用伪标签,然后结合生物学规则提炼标签,建立miRNA与lncRNA的关系,再结合专家知识和经验开发的生物信息学识别方法,建立miRNA与信使RNA(messenger RNA,m RNA)的关系,进而建立三种RNA之间的关系,接着结合分子生物学实验测定三种RNA的表达量,构建lncRNA-miRNA-m RNA调控网络,最后通过GO富集分析预测miRNA与lncRNA相互作用的功能。实验结果表明,DPEP的性能优于目前先进的预测方法,结合DPEP和生物技术成功构建了调控网络,并预测出miRNA与lncRNA相互作用参与的多项生命活动和涉及的多个生物学功能。
其他文献
空间机器人在燃料加注和在轨组装等复杂的空间任务中扮演了至关重要的角色。受到自由度与几何尺寸的限制,安装多连杆机械臂的传统空间机器人在非结构化环境中难以顺利执行任务,极易与目标发生刚性碰撞。由基座、太阳帆板和连续型机械臂组成的空间连续型机器人可有效避免上述问题,其携带的连续型机械臂可以实现柔顺性操作,适用于非结构化环境。更重要的是,连续型机械臂与航天员之间的交互更加安全。显著的优点使空间连续型机器人
学位
目前深海油气开发系统可分为干式采油系统与湿式采油系统两类,而两类采油系统都存在不足之处,例如干式采油系统存在浮式平台主尺度过大以及定位要求高等技术局限,湿式采油系统则存在钻井成本高昂和流动保障困难等缺陷。针对上述问题,大连理工大学黄一教授团队提出了深海人工海床(Deepwater Artificial Seabed,DAS)系统概念。DAS系统通过海底、水中和海面等子生产系统的分层设计,克服了现有
学位
为预防重大事故发生,减小重大事故后果造成的恶劣影响,海洋平台上设置了大量具有特定安全功能的安全关键设备。然而,安全关键设备的随机硬件失效和系统性失效风险同样会严重威胁海洋平台的服役安全。目前,预防性维护是保障海洋平台安全关键设备正常实现安全功能的主要措施。现有海洋平台安全关键设备的预防性维护通常为基于工业经验的定期维护,忽略了设备退化的动态特性、预防性维护作业造成的风险增加及维护成本对维护间隔决策
学位
搅拌摩擦增材技术(Friction Stir Additive Manufacturing,FSAM)是基于搅拌摩擦焊(Friction Stir Welding,FSW)发展出的一种新型固相增材制造方法,属于ASTM F2792标准中的叠层增材(Sheet lamination),通过设计计算机程序控制搅拌头的行进轨迹以确定叠层增材中的选区范围。与FSW不同,FSAM中搅拌针长度大于板厚从而保证
学位
热—弹性问题在工程应用中广泛存在,针对热—弹性问题的数值模拟需要准确的材料传热和力学本构模型。随着材料科学的不断发展,具备高性能或特殊功能的新材料不断涌现,然而各种新材料的性质千差万别,现有本构模型不一定能反映材料实际的热—力学行为。因此,迫切需要针对各类新材料建立其热—力学本构模型,从而开展相应的热—力学数值模拟,加速新材料走向工程应用。然而,通过传统方法建立热—力学本构模型往往需要对材料内在变
学位
目标追踪旨在研究在连续多帧数据中稳定准确地追踪感兴趣的物体。它是下游任务进行场景分析和规划决策的研究基础,是赋予计算机感知并理解世界能力的重要一环。当前,多种类型的传感器的普及为人们应对各种复杂场景任务提供了不同的手段。其中,以视频或点云为载体的多媒体数据正在渗透到人们生产和生活中的各个领域。受益于海量数据的积累以及算力的提升,深度学习为目标追踪领域的研究赋予了新能量。本文利用孪生神经网络结构研究
学位
有限元方法是在当今科学与工程计算中广泛应用的数值方法.比例边界有限元方法(SBFEM)是一种以有限元方法为基础的半离散半解析的数值方法,它结合了有限元方法和边界元方法的优点,同时又保持自身的特点.不同于传统的有限元方法,在比例边界有限元方法的推导和求解过程中,控制方程(二阶偏微分方程)被转换为一个二阶常微分方程组.通过假设通解为一些幂函数的线性组合,齐次二阶常微分方程组(无体力项)的求解可转化为计
学位
随着材料科学与工业技术的快速发展,航空航天、家用电器、医疗器械、汽车、建筑等各领域对高性能新材料的需求与日俱增。于此同时也给新材料与结构的尖端制造和安全评估所需的固体力学模拟带来更严峻的挑战。固体力学模拟离不开材料的本构模型,准确地建立新材料的本构模型,提出数值实现方法,是解决挑战的关键一环。然而,传统本构模型的建立需要很高的智力和时间成本,如著名的Neo-Hookean、Ogden、Hill、D
学位
现代尖端工业装备的设计和分析过程离不开固体力学模拟,而固体力学模拟又离不开材料的本构模型。随着材料科学的发展,大量性能优异的新材料出现。但若没有描述这些新材料的本构模型,则很难将这些材料充分应用到尖端工业装备的制造中。传统材料本构模型的建立往往需要花费很长时间;即使采用已有本构模型来描述部分新材料的力学行为,从现有本构模型中选出恰当的模型也并不容易。这些困难制约了新材料在尖端工业装备中的应用,也限
学位
动网格技术对计算流体力学具有重要的意义,如机翼颤振、多体分离、流固耦合等许多带有运动边界的非定常流动问题都需要用到动网格技术。动网格技术主要包括网格变形、网格重构以及网格变形和网格重构相结合等方法。只采用网格变形方法不能解决所有的问题,在实际应用中经常需要与网格重构相结合,但网格重构会改变原有网格的拓扑,导致新旧网格之间的流场信息传递出现额外误差,降低计算的精度。因此需要在保证网格质量的前提下尽可
学位