基于网络表征学习和深度学习的药物重定位方法研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:vvx888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
开发一种治疗疾病的新药是一种非常漫长和昂贵的过程,为已知药物确定新的疾病适应症,即药物重定位,有助于减少药物的研发成本。目前,大多预测药物相关疾病的方法都是综合利用与药物和疾病相关的数据。然而这些方法虽然聚焦在整合多种药物特征,并没有考虑到各种特征间的多样性。此外这些方法尽管利用了药物和疾病相关的各种数据,但是它们都是根据浅层模型提出的,很难挖掘出药物和疾病之间复杂的关联关系。这些不足将在一定程度上影响预测方法的型性能。本文提出三种药物-疾病关联预测方法,第一种是基于传统网络表征学习(非负矩阵分解)的关联预测方法;第二种和第三种是基于深度学习的方法。
  (1)基于非负矩阵分解的关联预测方法(DivePred)
  在这部分研究中,提出了一种基于传统网络表征学习(非负矩阵分解)方法,DivePred,来预测药物相关疾病。DivePred整合了疾病相似性、药物-疾病关联以及药物的多种特征包括药物化学结构特征、药物目标域特征、药物目标注释特征以及与药物相关的疾病特征。原始药物特征具有稀疏性以及较高的维度,DivePred基于非负矩阵分解将药物特征投影到低维特征空间,取得药物稠密的特征表示。由于不同的药物特征从不同的角度体现药物的本质,因此DivePred使用一个优化项,增强了多样性且减少了多种药物特征的冗余性。此外,DivePred通过拉普拉斯结合邻居信息以提高算法的性能。实验结果证明,DivePred优于其它几个较好的药物-疾病关联预测方法。
  (2)基于多路卷积神经网络的药物-疾病关联预测方法(CAPred)
  原始信息特征基于非负矩阵分解从而达到特征的降维,并通过迭代拟合获得特征信息。这种传统的表征由于很难能捕捉到药物与疾病之间多种复杂的、非线性的连接关系。因此,在这部分提出深度的网络表征学习以及药物疾病关联预测方法(CAPred)。首先根据四种药物相似性构建了四个不同角度的药物相似性网络,并结合疾病相似性和药物-疾病关联信息构建了四个药物-疾病异构网络。基于药物和疾病相关的各种生物学前提,从生物学角度构建了四种药物-疾病节点对嵌入矩阵。设计了基于卷积神经网络的框架从四个不同的药物-疾病嵌入矩阵中捕获了不同的结点对深层特征表示。此外,由于多个来源的特征对预测结果的贡献不同,这部分提出使用注意力机制来区分不同特征的贡献。对比结果显示,CAPred预测性能优于其它的几种预测方法。
  (3)基于全连接自动编码器和卷积神经网络的关联预测方法(ANPred)
  ANPred从药物和疾病的相似性以及关联数据中学习和整合节点对属性信息以及邻居拓扑信息。设计了基于多层卷积神经网络的学习框架,用于从药物和疾病的相关数据中学习一对药物和疾病节点的属性表示。为了捕获节点的邻居拓扑结构,建立了随机游走策略来形成邻居节点序列。基于全连接自动编码和skip-gram的框架被开发来学习节点的邻居拓扑表示。交叉验证结果以及五种药物的案例表明了ANPred不仅优于几种新进的方法,更有能力发现潜在的候选疾病。
其他文献
随着网络物理系统的发展,与物理系统相结合的分布式资源分配策略越来越受到重视,并取得了许多有价值的研究成果。但相关成果主要针对一阶或二阶积分器系统等多自主体系统展开,缺乏对具有更复杂动态网络的分布式资源分配问题的研究,关于实际系统中存在的不确定性因素对最优资源分配算法性能的影响的讨论也较少。因此,本文首先研究一类高阶严格反馈型不确定非线性多自主体系统的分布式资源分配问题,然后在此基础上考虑事件触发策
学位
伴随着国家政策对环保的重视,相关排放法规的要求越发严格,发展新能源汽车成为汽车行业的新方向。电动汽车作为新能源汽车的主要代表之一,受到了广泛的关注和重视。随着出行安全性和舒适性要求的逐渐提高,电动汽车ECU(Electronic Control Unit,电子控制单元)软件开发也面临着诸多挑战。中央控制单元是电动汽车重要的ECU之一,具有整车控制和远程监控功能,通过CAN(Controller A
学位
学位
学位
近年来,深度学习越来越多地被应用到各个领域,计算机与其他学科之间的交叉程度越来越大,而分子生成就是其中一个重要的部分。分子空间异常庞大,而已知的分子在其中不过是很小的一部分。为了发现更多潜在可用的新分子,近年来研究人员尝试利用深度学习的方法生成新分子,提出了大量的分子生成模型。这些分子生成模型通常要求输入与输出类型相同,即若输入是字符串则输出也是相同意义的字符串,若输入是邻接矩阵则输出也是邻接矩阵
学位
随着各种基因检测技术的发展,人类获得的数据越来越多,但是其中与特定疾病相关的基因数量却很少,人类现有的能力还是不能发现人体致病机理的秘密,本文研究的内容就是充分利用有限的资源来挖掘出可能致病的基因。现有的算法对复杂疾病的致病基因的发现能力较弱,深度学习却能很好的预测它们。由于推荐算法与致病基因发现任务具有相似性,所以本研究进行了借鉴和学习。本论文主要有以下三部分工作内容,首先,从海量基因中选择候选
显著性目标检测是从一幅图像中检测出前景的轮廓,其在深度学习中具有广泛的用途,是很多计算机视觉任务的首要工作。由于越来有多的任务都需要依靠显著性目标检测来完成,最近几年这个任务成为了人工智能热门的研究方向。现有的方法在检测简单的场景时效果非常的好。然而,针对一些复杂场景,例如图像中包含不规则目标、多目标、小目标等场景,或者目标边界轮廓比较复杂等情况,现有的检测方法无法有效的处理这些问题。很多方法预测
随着计算机和互联网的飞快发展,百度、新浪、字节跳动和网易等互联网企业也快速发展起来。伴随着互联网企业的快速发展大量的数据喷涌而来,信息过载导致用户不能快速的筛选对自己有帮助的信息。为此,研究者们开始着力于开发推荐系统帮助用户进行决策。推荐算法包括传统推荐算法和基于深度学习的推荐算法。目前,传统的推荐算法和基于深度学习的推荐算法面临的挑战都是数据稀疏和冷启动。数据稀疏是由于用户项目之间的交互数据过少
学位
伴随着移动互联网和大数据的高速发展,互联网产生大量的数据,这些海量的数据在给我们带来丰富选择的同时,也给我们带来了信息过载的问题。推荐系统旨在根据用户和项目之间的交互历史来自动构架用户和项目的之间的联系。学术和工业界的研究表明,推荐系统能够有效解决信息过载问题,提升数据的利用率。然而传统的推荐算法受限于有限的附属信息和模型结构,无法实现理想的效果,而且非常容易受到数据稀疏的影响,尤其是冷启动问题。
学位
睡眠是一种复杂的生理活动过程,充足的睡眠时间和高质量的睡眠质量是人体生理健康和心理健康的必要条件。睡眠障碍严重影响人类健康和生活,将睡眠阶段准确的分类是检测和治疗睡眠障碍的关键,睡眠阶段分类也称之为睡眠分期。在睡眠分期领域,主流的深度学习方法在同一层次上仅仅使用了某种单一的关系归纳偏置,这会使得深度学习方法的特征提取方式不够完备并导致该方法的性能受到限制。本文使用平移不变性、时间不变性和分层处理等
学位