【摘 要】
:
近年来,随着疫情形势的愈发严峻和各类疾病的爆发,对于药物的需求愈发突出和显著。目前,新型药物的研制过程成本高、耗时长,所以药物再利用逐渐成为一种研发新型药物分子的可替代方案。该方案的关键在于如何在海量的药物-靶标相互作用关系中快速筛选出具有实际意义的关系对。因此,本文聚焦药物与靶标相互作用(Drug-Target Interaction,DTI)预测这一问题,具有重要的理论研究意义和实际应用价值。
论文部分内容阅读
近年来,随着疫情形势的愈发严峻和各类疾病的爆发,对于药物的需求愈发突出和显著。目前,新型药物的研制过程成本高、耗时长,所以药物再利用逐渐成为一种研发新型药物分子的可替代方案。该方案的关键在于如何在海量的药物-靶标相互作用关系中快速筛选出具有实际意义的关系对。因此,本文聚焦药物与靶标相互作用(Drug-Target Interaction,DTI)预测这一问题,具有重要的理论研究意义和实际应用价值。现有的药物-靶标相互作用预测方法主要使用的是药物一维序列提取特征。这种建模方式忽略了药物分子的结构特点,为充分利用药物结构信息,本文将重点研究基于图神经网络的药物分子表示方法及其在药物-靶标相互作用预测问题上的应用。主要研究工作如下:本文提出了一种基于药物图神经网络表示的药物-靶标相互作用预测方法,称之为Graph Neural Network Drug Target Affinity(GNNDTA)。该方法使用图卷积网络(Graph Convolutional Network,GCN)、图注意力网络(Graph Attention Networks,GAT)、广义聚合网络(GENeralized Aggregation Network,GEN)和图同构网络(Graph Isomorphism Network,GIN)等四种图网络模型对药物数据建模,提取药物分子特征表示,再结合靶标的氨基酸序列表示预测药物-靶标结合亲和力。在公开数据集Davis和KIBA上,所提方法在主要指标MSE上均优于基线模型。四种图神经网络模型中,使用GIN的GNNDTA模型在Davis上取得了最优性能;使用GCN的GNNDTA模型在KIBA上取得了最优性能,与基准方法相比,主要指标MSE分别降低了0.026和0.029。在使用图神经网络提取药物表示的基础上,本文进一步融入药物序列表示,提出了基于药物图与序列表示融合的DTI预测方法,采用平均相加、可学习加权参数和注意力机制等方式获得药物特征向量,该方法称为Graph-Sequence Fusion Drug Target Affinity(G-SFusion DTA)。实验结果表明,G-SFusion DTA实验效果比GNNDTA更好。此外,本文比较了CNN和Transformer两种药物序列表示的对实验结果的影响。在Davis数据集上,使用GEN+CNN药物特征表示的模型获得最优MSE性能;在KIBA数据集上,使用GEN+Transformer药物特征表示的模型获得最优MSE性能,与GNNDTA模型最好结果相比分别降低了0.01与0.021。
其他文献
如今,人工智能正在深刻影响和改变着我们的世界,智能人机交互的发展及应用极大程度上提高了我们的生活质量。语音合成技术能赋予机器像人一样自如说话的能力,是智能人机交互中非常重要的一环。近十年,基于神经网络的语音合成系统可以更快速地合成高质量音频,逐渐成为了主流。在汉语作为母语的同时,英语也逐渐成为我们的第二语言,中英文混读现象日益常见,中英文跨语言语音合成需求越发迫切。然而,主流的语音合成模型往往仅支
近些年来,数据隐私泄露事件频发,隐私泄露造成的危害越来越大,数据隐私保护变得尤为重要。联邦学习可以在保护数据隐私的同时,挖掘数据价值。然而,标签噪声数据严重影响联邦学习模型效果,阻碍联邦学习的应用。目前联邦学习场景下的标签噪声调试研究主要是通过选择数据质量高的联邦节点或者标签正确的样本数据,来减少标签噪声对联邦模型的影响。但是,上述方法难以兼顾过滤数据集的纯度和丰度。节点选择方法没有真正识别噪声数
会话推荐算法根据已知的会话数据,对用户下一时刻可能的行为进行预测,其中会话数据指用户在Web应用上的多个点击等交互行为组成的序列数据。会话推荐算法可以使用用户的单个会话或多个历史会话来进行推荐,一般而言,都需要从用户行为信息中建模出其长期偏好(静态意图)和短期偏好(动态意图)再进行推荐。基于图神经网络的会话推荐将会话转化为会话图,并从中捕获交互项之间的复杂转移关系,从而更全面地建模用户意图。不过当
随着物联网技术的发展和全景成像技术的成熟,全景相机在商场和会展中心迅速普及,涌现出越来越多依托全景图像的视觉应用需求,例如物联网设备可以通过分析视线信息来理解人的行为和意图。目前视线方向识别的研究主要是基于眼球或人脸特征的视线估计方法,面对的大多是受控场景下的视线估计。当面对全景相机所应用的复杂非受控环境时,传统方法视线方向识别精度低,因此本文将研究面向全景图像的多行人视线方向识别,先对多行人目标
背景肺炎克雷伯菌(Klebsiella pneumoniae,KP)是在社区和医院感染中获得的最常见的革兰阴性菌,近年来,高毒力肺炎克雷伯菌(hypervirulent K.pneumoniae,hv KP)感染的发病率和死亡率持续增加。肺上皮细胞针对入侵的病原体有复杂的防御机制,其中Toll样受体(Toll like receptors TLRs)的表达可诱导激活肺上皮抗菌途径及气道炎症反应。有
目的:研究右半结肠癌淋巴结转移的相关规律,探讨淋巴结转移与右半结肠癌分化程度、肿瘤位置、浸润深度等相关因素的关系,并进行相关统计学分析,从而指导临床中右半结肠癌淋巴结相关清扫范围。方法:收集2018年9月至2021年10月在安徽医科大学第二附属医院胃肠外科就诊并实施CME右半结肠癌D3根治术手术共52例患者的临床相关资料,如年龄、性别、肿瘤大体分型、肿瘤浸润深度(T分期)、术前血CEA(carin
人机对话是人类与计算机之间进行交互的主要方式之一。其中,任务型对话系统通过与用户进行对话帮助用户完成预定任务,以其简单便捷的特点被广泛应用。自然语言理解是任务型对话系统的关键模块,其包含意图检测和语义槽填充两个任务,为后续模块提供语义理解支持。现有的对话语言理解方法大多需要收集大量领域特定的标注数据进行训练,才能达到较好的性能。然而随着对话任务场景的快速增加,往往在新领域难以获取到如此庞大的训练数
目的:研究胃肠间质瘤患者血浆外泌体mi RNA和正常人血浆外泌体mi RNA表达差异谱,筛选出间质瘤患者血浆外泌体中特异mi RNA,为进一步研究间质瘤血浆外泌体mi RNA生物学特性提供理论基础。方法:选取2020年6月~2021年6月本院收治的5例间质瘤患者和5名体检的健康人作为研究对象,提取间质瘤患者和健康人血浆外泌体中的mi RNA,采用高通量RNA测序法检测外泌体中的mi RNA,与RN
区块链是一个去中心化的分布式账本,具有去中心化、数据不可篡改、数据透明可追溯等特性,与传统的中心化数据库相比,其具有不可比拟的优势。研究者利用区块链的特性,将区块链应用到其它领域。在研究者利用区块链解决其它领域问题时,忽视了区块链存在的问题。区块链本身查询能力不足,目前仅仅支持查询少数键值的查询,难以支撑区块链作为数据库的高效性。同时,由于区块链上数据是透明的,每个节点都可以访问区块链上的数据,因
行人检测旨在从图片或者视频中自动定位行人。在研究领域,行人检测是行人分析任务如行人跟踪、行人重识别等的前置环节。在应用领域,行人检测是自动驾驶、智能安防等系统的重要组成部分。相比人类发达的视觉能力,行人检测算法的错误率还需要进一步降低。行人检测存在两个问题,一是夜间场景下行人置信度低而背景置信度高。二是大规模场景下行人的外观差异性巨大。现有的行人检测算法简单地一对一学习正负样本,缺乏对前景背景的深