基于异质图神经网络的生物分子互作关系预测算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:clarkkevin_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物体分子之间相互作用是一种复杂的生物机制,涉及到生物学中许多分子之间的非线性动态关系。如何更好地整合这些不同分子之间的复杂关系是一个具有挑战性的问题。lncRNA与miRNA是两类非常重要的非编码RNA,lncRNA是长度大于200个核苷酸的非编码RNA,另一方面,目前99%以上的lncRNA功能未知,这与lncRNA重要的生物医学价值之间存在着巨大的矛盾,如何快速推断lncRNA功能是当下生物信息学领域的热点研究之一。lncRNA与蛋白质互作是lncRNA最重要的分子作用机制,研究lncRNA与蛋白质的互作关系是探索lncRNA功能和分子机制的关键途径。传统的预测lncRNA与蛋白质互作关系的实验方法既耗时又昂贵。许多基于机器学习的计算方法已经被开发出来用于预测lncRNA与蛋白质互作关系。然而,发现lncRNA与蛋白质的互作关系仍然是一个挑战。而miRNA是长度约为22个核苷酸的非编码单链RNA分子,参与众多生物调控过程,与多种疾病密切相关,已成为新的疾病诊断与治疗的候选分子靶标。目前已知的预测miRNA与疾病关联仍非常有限,因此构建计算模型预测潜在的miRNA与疾病的关系是非常迫切的,具有挑战性的。我们的研究围绕lncRNA与蛋白质互作关系预测以及miRNA与疾病关联预测展开,分别构建了两个图神经网络模型用于lncRNA与蛋白质互作关系预测以及miRNA与疾病关联的预测。为了更好地集成异质网络信息,在本文研究的第一部分提出了一种用于LPI预测的多阶异质图神经网络模型HGNN_LPI。首先,基于多阶邻域构建了一个lncRNA与蛋白质互作的异质网络,包括lncRNA与疾病关联关系、蛋白质与疾病关联关系、lncRNA与lncRNA互作、蛋白质与蛋白质互作和lncRNA与蛋白质互作;然后,应用异质图神经网络来捕获更深层次的语义和拓扑属性;从异质网络中提取特征后,进一步对不同分类器进行全面评估,选择最优的分类器模型;并将该模型分别与常用的同质网络表示模型和异质网络表示模型进行了全系统比较,验证了我们提出的模型的有效性;最后,开发了在线服务平台(http://hgnnlpi.com/),为用户提供最大限度的可用性。在本文研究的第二部分,提出了基于分层异质图卷积网络的miRNA与疾病关联关系预测的模型HGCN_MDA。主要工作包括:首先,收集了miRNA和疾病,miRNA和miRNA以及疾病与疾病之间的关联关系;然后计算节点在图中的属性并作为指标对网络进行分层,进一步构建多层网络分别提取节点的全局向量表示和局部向量表示,并根据重要程度对不同向量进行整合,最后采用全连接层构建预测模型,结果显示该模型具有良好的表现。
其他文献
糖尿病前期是发展为2型糖尿病的一个特殊阶段。糖尿病近年来患病率不断上升,有效干预糖尿病前期是预防及延缓糖尿病的重要措施。目前越来越多的临床研究证实针灸疗法可有效控制血糖水平,改善糖脂代谢、胰岛素抵抗,促进胰岛素分泌。现从针刺、灸法、穴位埋线、穴位注射、电针等方面,对近年来针灸干预糖尿病前期的研究进展进行概述,总结现有研究存在的不足,为临床治疗糖尿病提供参考。
期刊
资源、能源是社会进步的基础,是经济发展的命脉,因此,能源的使用安全与我国的国计民生紧密相连。而随着经济的快速发展,我国各行各业都加大了对能源的需求量,因此这也直接导致电煤的价格居高不下。再加上,现阶段我国正处于供给侧改革的黄金阶段,新能源的开发和利用,也成为了有关企业关注的重点。而本文通过对某电厂330mw火电机组厂用电数据的实际分析,来进一步探寻相关的节电措施,希望能在此基础上实现经济效益,生态
会议
目的:探讨持续质量改进在没有信息平台情况下准确采集护理敏感质量指标的应用效果。方法:通过对每个季度人工采集的相关数据进行分析、研究,针对错误数据找出问题所在、分析原因、制定整改措施、做出效果评价并进行数据比较。结果:持续质量改进后,第三季度人工采集护理敏感质量指标数据的错误率比第一、二季度明显下降,P<0.001。结论:通过持续质量改进模式可以提高人工数据采集护理敏感质量指标的准确率,从而提高信息
期刊
大概念教学是化学复习的重要方式,便于在回顾、理解知识的同时,实现知识整合,增强复习效率。教师应建构并完善大概念统领下的复习教学模式,高效开展化学复习课。
期刊
<正>肝硬化是一种慢性进行性肝病,其起病隐匿,对患者的生存和预后带来极大的威胁。肝硬化的患病危险因素包括饮酒、代谢综合征、慢性病毒感染、遗传易感性疾病和自身免疫性肝病等。不同病因导致的长期肝组织炎症和弥漫性肝损伤可导致纤维化,并最终发展为肝硬化。肠道菌群与人类的健康与疾病密切相关。肠道菌群基因组包含超过300万个基因,而人类基因组则由大约2万多个基因组成,表明对肠道菌群的探索空间仍很大[1]。肠道
期刊
伴随着新媒体环境下的互联网浪潮,个人品牌这一概念逐渐被人们所重视,它所展示的影响力与商业潜力吸引了许多学者研究探讨。当下,学术研究将重点放在了个人品牌传播中蕴含的传播学原理中,在互联网传播一线,专家学者则把注意力聚焦在构建个人品牌的要点中。本文首先对比了印刷传播、电讯传播、互动传播三个传播环境下个人品牌传播的特点与优势,并且聚焦互动传播环境下的个人品牌,对个人品牌的传播特点进行深入探究。本文选取李
学位
随着微电子信息通讯及半导体等尖端科技的迅猛发展,工业界对磷和铟高纯原料的需求量急剧增加,同时对其纯度的要求愈加苛刻。本文综述了这两类材料提纯技术的研究进展,并从材料科学、提纯技术及研究方法三方面对其未来发展提出了一些建议。
期刊
支持向量机(support vector machine)是一种应用非常广且应用效果比较好的分类器,虽然其分类效果较佳,但是其算法的效率和分类的准确性非常依赖具有区分能力的特征子集、较为适合的误分类惩罚参数和核函数参数。在分类实验中,数据和特征对于实验的效果具有很大的影响,因此我们在采用标准UCI数据集的基础上进一步进行特征选择。从一般的认知来说,越多的特征子集对于构建模型的帮助越大,但是特征集中
学位
深度学习模型凭借着其强大的推断与拟合能力在图像识别、目标检测等应用领域中取得了重要的进展。然而,为了处理海量的数据,卷积神经网络模型也被设计得更加复杂。虽然凭借着层数更深,层间更宽的卷积神经网络模型能够获得理想的性能表现,但是在进行网络推断时所需的计算资源显著增加,这对硬件设备运行性能和内存空间都有着更高的要求,也就是说,深度神经网络需要依托于高性能的硬件设备来实现它的功能。显然,将深度学习模型推
学位
随着汽车行业的发展进步,汽车已经成了人们出行的主要交通工具。可随之而来的交通拥堵问题与安全隐患越来越严重。而且随着行业的快速发展必然使得未来的汽车保有量持续增高,对于现有的办法,比如车辆限号、扩大交通路网的建设等,无法从根本上解决问题。智能交通系统是一个解决该问题的方案,它是将多领域的先进技术紧密结合,加强车、路、人之间的联系,使交通系统更加高效安全。智能网联汽车在其中发挥重要的作用,C-V2X是
学位