基于异构网络的疾病基因关联预测方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:kangj04
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
疾病基因关联预测研究能够加速各种复杂疾病的发病机理理解,同时推动治疗药物的开发。传统的研究方法有繁琐的连锁分析、全基因组分析等,其优点是结果可靠性强,但是非常耗时。随着各类生物数据的产生,采用计算方法加速疾病基因的挖掘成为可能。目前计算方法可以在弱领域知识的场景下达到较好的效果,一般通过网络结构建模研究对象之间的关系。早期一些研究通过启发式网络指标分析预测节点的关系,完全根据拓扑结构预测的方法对现有的不完整的关系数据没有很好的应对。传统网络表示学习的方法通过随机游走、矩阵分解等方式生成节点表示再用于链接预测,这类工作中提出的为网络节点学习表示的思想一直持续到现在都是主流方法,但矩阵分解对于大规模网络的较弱扩展性没有合适的解决方案,随机游走对于异构网络的处理稍显不足。基于图神经网络的方法通过元路径解决异构网络的异构性,依靠图神经网络的强大表示能力学习节点的丰富语义信息。但是现有大部分异构图神经网络模型对于元路径本身的探索比较少,只关注元路径两端的节点,造成了节点向量的提前总结。本论文针对现有模型算法所出现的“提前总结”问题进行了研究改进。考虑到元路径本身是包含多种节点和关系的抽象对象,通过对元路径提取的同构网络采用图因子分解的方式解耦出元路径隐含的多种语义信息因子图,然后通过自注意力机制聚合各个因子图中的邻居信息进行拼接生成每种元路径下的局部语义向量,最后使用多元路径语义级注意力层聚合所有元路径向量,通过该向量计算疾病基因关系对的评分进行预测。通过对比实验分析,本论文的Factor HNE模型展示的性能超过了所有对比方法,对比同类型方法MAGNN在AUC和AP指标上提升了2~3%。后续本论文针对多个元路径的多语义融合方法探索了进一步改进方案。通过基于共同分布编码的方法对多个元路径语义进行降噪得到所有元路径的共同语义信息,经过信息激发层后再与编码前向量联合进行互信息最大化操作,使得融合的信息最大化增益下游链接预测任务。经过对比实验发现本论文提出的方法在两种基础模型上分别取得了4%、1%的AUC和AP性能提升。
其他文献
随着移动互联网的迅猛发展,在线社交网络成为人们沟通交流的重要工具,使病毒式营销得到广阔的应用。病毒式营销即为社交网络中的种子用户免费提供产品,这些用户将产品推销给他们的粉丝以及粉丝的粉丝。关于产品的信息能病毒似的一层层扩散,产生大规模的营销效果,企业也因此可以获得巨大的收益。当前的研究工作大多集中于一种产品在一个批次中病毒式营销。然而,在某些场景下,企业需要对多种不同型号的产品进行多批次病毒式营销
学位
近年来深度学习快速发展,在学术界和工业界成为研究和应用的热门领域。随着深度学习网络参数量的增大,对训练数据的需求也越来越高。然而在一些实际应用领域中,数据采集难、标注成本高和隐私政策等因素的限制,使得传统深度学习方法需要尽可能地减少对数据的依赖。因此少样本学习成为了当前的学术热点,该方法的目标是只利用少量的训练数据样本来获得较好的学习效果。少样本学习可以分为基于优化学习和基于度量学习两个视角。本文
学位
目前恶意代码检测方法的研究主要集中在特征表示上,如恶意代码的API调用序列、程序控制流图等,这些方法虽然取得了一定的效果,但可读性和可解释性较差,不利于人们理解恶意代码的行为。本文通过构建恶意代码知识图谱的方法提高恶意代码检测的效果和可解释性,知识图谱是一种由实体和关系组成的知识库,具有形式简洁、可解释性强等特点,经过近几年的快速发展,知识图谱已经运用到了各行各业中,如搜索引擎、推荐系统、智能问答
学位
过去几十年,中国迎来了社会经济的高速发展以及社会福利制度的高度完善,人们的生活方式也伴随性的出现了相应的转变。但面对持续性高热量食物的摄入以及工作方式的变化,代谢性疾病的患病率也出现了大量的增加,包括肥胖、2型糖尿病、非酒精性脂肪肝和心血管疾病等。当机体长期处于吸收大于外排、能量摄入大于能量消耗时,多余的能量和物质则会主要以脂肪酸的形式储存在脂肪组织中,最终诱发肥胖等疾病的产生。流行病学研究指出,
学位
氧是机体新陈代谢和维持生存的重要因素之一。脑是对氧需求最高的器官,在某些生理或病理性的低氧条件下,细胞可通过低氧感知信号通路和能量代谢转变来维持细胞功能。低氧诱导因子-1(Hypoxia-inducible factor-1,HIF-1)是细胞感知低氧的关键因子,可启动一系列下游基因的表达以适应氧浓度的变化。HIF-1靶基因参与细胞代谢、生存与增殖、细胞凋亡和神经发育等生物学过程。低氧是一把双刃剑
学位
目前,治疗慢性创面的临床策略有限,尤其是在止痛和伤口快速愈合方面。因此,迫切需要开发替代治疗方法。近年来研究电纺纳米纤维支架如何促进伤口愈合,以及如何利用静电纺丝技术制备多维、多孔、多功能的纳米纤维支架等技术,极大地促进了组织工程的发展。尤其电纺纳米纤维支架搭载多功能纳米材料技术极大地促进了伤口愈合敷料的发展。因此,将可控载药敷料与诱导干细胞分化相结合,以及纳米颗粒与聚合物之间的相互作用已引起人们
学位
区块链作为分布式系统的重要技术之一,具有去中心化、不可伪造和可溯源的特性,其使用了密码学、分布式和隐私保护等相关技术,旨在解决分布式系统存在的高成本、低效率和数据归属等问题,同时区块链还在医疗、征信和供应链等多个领域也有广阔的应用。共识协议是无中心机构的分布式一致性协议,能够解决区块链系统的信任问题和数据同步问题,对区块链系统的安全及性能具有重大影响,比如51%恶意攻击、交易延展性攻击、低吞吐量和
学位
食管癌具有预后性较差,高发病率,高死亡率等特点,严重威胁我国居民健康和生命安全。而调强适形放射治疗(Intensity modulate radiotherapy,IMRT)在提高靶区适形度和剂量均匀性的同时,更能有效地降低靶区周边正常组织的照射剂量,间接提高患者的总体治愈率,目前已成为食管癌治疗的主要技术手段之一。但在调强放疗计划设计过程中,由于放疗物理师需凭借个人经验反复调整目标函数和权重并不
学位
目的脑是微波辐射敏感靶器官,其中海马是重要的敏感脑区。前期研究发现,海马胆碱能系统功能紊乱参与微波辐射所致神经行为改变的病理生理学过程,但其作用机制尚未阐明。本课题基于光纤记录、光遗传、化学遗传等技术探讨海马胆碱能神经元在微波辐射致神经行为改变中的作用及其机制。方法1微波辐射小鼠模型建立:选取C57BL/6野生小鼠125只(24只用于Morris水迷宫实验,30只用于穿梭箱实验,24只用于Y迷宫、
学位
刺激—响应实验模式是脑科学研究的一种常用实验范式,这种范式要求使用外部设备产生刺激,同时测量其诱发大脑或肢体所产生的反应,从而探索相应脑区的工作机制或脑疾病的发病机制。这种范式常用于脑科学、行为科学、神经科学等领域。这些领域的研究人员经常会使用Psych Toolbox、Psychopy、E-prime、Open Sesame等软件来呈现视觉刺激,通过记录呈现刺激的时间和做出响应的时间来判断机体的
学位