面向多源异构数据的疾病与非编码RNA关联预测研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:buynewer1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长链非编码RNA(long non-codingRNA,lncRNA)是非编码RNA的重要组成单元。多项研究表明,lncRNA通过细胞增殖、凋亡、代谢等方式参与多个生命过程,与多种人类疾病的形成、发展和预后治疗有关,成为调控细胞功能的重要因子。然而,由于传统生物实验方式探寻致病lncRNA时间长、成本高,限制了lncRNA在疾病相关领域的发展,利用可计算模型预测lncRNA-疾病关联,对于人类疾病的研究与治疗意义重大。目前,现有数据库中由实验佐证的有限lncRNA-疾病关联数据,所存在的固有稀疏性,导致当前大多数的lncRNA-疾病可计算模型的预测精度偏低。针对现有关联预测模型中存在的问题,本文构建了基于图注意力网络和归纳式矩阵补全的关联预测模型,在提高预测精度基础上,降低了计算时间成本,主要内容如下:(1)针对现有的数据稀疏性导致的预测精度不高的问题,本文在GAT双聚合运算和归纳式矩阵补全的基础上设计lncRNA-疾病关联预测模型DFMP-LDA。第一步,建立疾病、lncRNA相似性网络;第二步,引入多头注意力机制,构建“加”和“连接”双重聚合器,加强lncRNA节点特征和疾病节点特征;第三步,将加强后的特征输入到归纳式矩阵补全过程中;最后,使用RMSprop优化器对模型进行优化。DFMP-LDA模型通过五折交叉验证后取得0.9240的AUC值,0.7924的AUPR值。比当前的GAMCLDA模型、SDLDA模型、DMFLDA模型,AUC值分别提高4.12%、6.69%、9.21%。(2)为了进一步解决模型预测精度和时间成本的问题,在DFMP-LDA模型的基础上,提出基于GAT多重运算和归纳式矩阵补全预测lncRNA-疾病关联的改进模型MFMP-LDA。第一步,使用高斯相互作用谱核相似性,构建多源异构相似性网络;第二步,在DFMP-LDA模型的双重聚合器基础上继续改进,设计多重聚合器,该聚合器进一步增强了lncRNA节点和疾病节点特征;第三步,将增强后的特征输入到归纳式矩阵补全过程中;最后,使用Adam优化器对模型进行优化。MFMP-LDA模型通过五折交叉验证后取得0.9395的AUC值,0.8057的AUPR值。比DFMP-LDA模型AUC值和AUPR值分别提高1.67%、1.68%。时间成本上,比DFMP-LDA模型降低3.22%。综上所述,本文提出的DFMP-LDA和MFMP-LDA关联预测模型在预测精度上与当前的计算模型相比均有提高,具有最优的预测性能。
其他文献
随着5G通讯技术和物联网技术的飞跃式进步,定位导航技术在导航、医疗等领域中都有着至关重要的作用,在生活中通过手机等智能便携设备来获取人们的位置信息,已然成为了当代人生活的日常,室内定位也逐渐成为了人们的硬性需求。而机器学习所具备的高纬度建模能力,能够解决很多传统模型在复杂的室内场景下难以处理的问题。因此本文基于机器学习所具备的优势,重点研究了K近邻(K nearest neighborhood,K
学位
随着电力电子技术发展水平的快速提高,电机调速系统在军工业、农业乃至日常生活中都得到了广泛的应用,永磁同步电机(Permanent Magnet Synchronous Motor,PMSM)是一种交流电源设备,因其特殊的内部构造有体积小、质量轻、使用寿命长等特点,并且PMSM调速系统具有响应速度快、准确、调速范围宽等优点,这让PMSM在精密数控机床、智能机器人、航天航空等领域展现出其调速系统的优势
学位
近年来,随着人工智能技术逐步渗透到国防、教育、金融等各种各样场景,人工智能技术在为人们提供便利的同时也暴露出大量的隐私安全问题。特别是针对深度学习的反转攻击变得越来越频繁。反转攻击是攻击者利用受害者模型能够“记住”训练数据特征的特性,通过使用非法手段,获取受害者模型训练数据信息的攻击手段。如基于自动编码器的反转攻击模型。在模型训练过程中,它假定攻击者能够访问数据本身,并利用均方误差方式窃取训练数据
学位
多目标优化问题普遍存在于工程领域和科学研究中,且往往面向复杂环境,形成约束多目标优化问题。多目标进化算法具有一次获得一组可行解、不依赖问题的特性,其结合约束处理技术形成约束多目标进化算法,被广泛用于解决约束多目标优化问题。近年来,已开发出多种约束处理技术并成功应用求解约束多目标优化问题。在解决约束多目标优化问题时,目标和约束之间的平衡至关重要。然而,约束条件会使许多可行区域变得不可行,并呈现出一些
学位
城市下水管道破裂、渗漏等问题会严重影响城市居民日常生活,缺陷检测是管道健康等级评估最重要的环节之一。人工判读的方式费时费力且过于依赖专家经验,而基于传统的计算机视觉的检测方法需要对特征提取器与分类器的设计要求高且只能检测特定的缺陷类型。近年来,随着深度学习在计算机视觉领域的快速发展和管道图像样本数量的增加,本文对基于深度学习的管道缺陷检测进行研究,主要的研究工作如下:(1)设计了一个分层的网络架构
学位
在我国大力实施“双创”的背景下,大学生已经成为“双创”的重要力量,如何科学、有效、系统地培养大学生的创新创业能力,应当引起高校和企业的高度重视。在组织实施的过程中,应当将校企协同人才培养模式与培养大学生创新创业能力进行有效融合,只有这样,才能促进大学生全面发展。本文对此进行了研究和探讨,在简要分析“校企协同”模式对培养大学生创新创业能力的重要价值的基础上,重点分析了“校企协同”模式下培养大学生创新
期刊
微生物与人类的生活息息相关,测序技术的发展使得微生物宏基因组学跨入新的发展时期,基于高通量技术扩增的生物学实验产生了大量16S r RNA(16S ribosomal RNA)序列信息,对产生的16S r RNA序列进行数据分析是生物信息学上一项严峻的挑战,其中一项主要的技术就是将16S r RNA序列进行聚类,从而分析环境中菌群物种丰度及多样性。目前,已经存在很多种不同的聚类算法,且均可实现有效
学位
深度学习作为新兴人工智能技术,在计算机视觉、自然语言处理等多个领域中占据领先地位。它依靠大规模带有标签的样本数据进行长时间的训练,从而获取具有高性能的模型,其性能远超传统算法。然而,在深度学习的众多实际应用中,获取大量带标签的样本数据很困难或者代价很高。在这种场景下训练模型,其泛化能力就会大大折扣。因此,适用于少量带标签数据场景的小样本学习便成了人工智能研究人员需要重点突破的任务。度量学习是小样本
学位
精准、高效、智能的伺服系统控制技术是当代轮胎胎面定长裁断工艺的发展目标。胎面定长裁断作为橡胶挤出联动线的重要工序,其定长与速度控制是决定成型定长胎面品质的关键因素,因此精准测控胎面的定长与运行速度能够有效提升制品的性能和生产效率、降低工业能源损耗。本文以胎面定长裁断伺服控制系统为研究对象,深入了解胎面定长裁断工艺过程及控制要求,分析定长裁断工序的组成结构及控制原理,明确定长裁断的控制变量,建立定长
学位
微电网的优化调度可以有效提高能源利用效率、减小环境污染以及降低系统运行成本,对微电网系统的经济、节能和稳定运行有着深远影响。但是近年来随着微电网的规模不断扩大,导致单个微电网的抗扰动性差和容量有限,所以互联局部区域的多个微电网,组成微电网群系统,可以有效提高系统的可靠性和经济性。因此,本文主要对单个微电网和由多个微电网组成的微电网群的优化调度问题进行研究。首先介绍了优化算法、微电网和微电网群的研究
学位