基于多头自注意力的多通道图卷积药物-靶点亲和力预测

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:jeff1986928
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用计算机的高性能辅助药物设计是一个十分有前景的领域,而药物-靶点亲和力的预测是计算机辅助药物设计的重要环节,它能提供药物分子和靶点蛋白相互作用强度的信息,从而判断小分子与蛋白质结合的程度。使用计算方法快速精准地预测靶点和药物间的亲和力值,不仅缩短了药物开发周期,而且节省了药物研发成本。近些年来,出现了各类预测药物-靶点亲和力值的计算方法,例如,分子对接、基于配体的方法以及机器学习与深度学习。上述方法中,深度学习作为机器学习的特别类型,在简化了数据特征提取步骤的同时,提升了模型算法的预测精度。图神经网络系列算法凭借其在结构特征学习中的优秀表现,逐渐在药物与蛋白质研究中得到应用。注意力机制能一步到位获取特征全局与局部的联系,同时被设计成并行模式以减少训练时间,被广泛应用于各深度学习研究中。在药物-靶点亲和力预测这一新领域中,图神经网络与注意力机制有着巨大的潜力。本文首先提出了一种基于多通道图卷积网络的药物-靶点亲和力预测的方法。此方法提取药物分子和蛋白质序列的理化特征以及相关图数据作为模型输入,其中图数据对应药物分子图与蛋白质靶点图的节点邻接矩阵。然后,构建一个聚合了不同距离结点信息的多通道图卷积网络,通过各通道的图卷积网络不同比例的累加,更为精确地学习到药物分子的特征。最后将模型提取到的药物特征向量同通过图卷积网络提取到的靶点特征向量进行拼接融合,经过全连接层获得最终的药物-靶点亲和力预测值。实验结果表明,在两基准数据集上基于多通道图卷积网络的模型取得了较好的结果,具有较好的药物-靶点相互作用亲和力预测效果。在此基础上,为了进一步提升模型预测速度,更好地学习模型特征,本文提出了基于多头自注意力的多通道图卷积药物-靶点亲和力预测模型。该方法中,药物分子的图数据依次经过稠密连接的图卷积模块、多头自注意力模块、多通道稠密连接图卷积模块、线性结合层、全局池化层以及全连接层,得到药物特征向量。接着,将药物特征向量与通过图卷积网络提取到的靶点特征向量进行拼接,经过全连接层获得最终的药靶亲和力预测值。实验结果表明,在两个基准数据集上,基于多头自注意力的多通道图卷积模型较先前模型有明显提升并取得了较好预测结果。综上,本文在多通道图卷积网络的基础上结合多头自注意力,构建预测模型并取得了良好的预测性能。研究旨在为靶点与药物间相互作用强度提供精准预测,从而在药物研发中减少成本,提升效率。
其他文献
目的:探讨青海地区藏、汉族人群中非酒精性脂肪性肝病(Nonalcoholic Fatty Liver Disease,NAFLD)与PNPLA3 rs738409基因多态性的相关性。方法:本研究的对象来自青海省人民医院消化科病区及健康体检中心,病例组为通过腹部超声诊断为脂肪肝的152位患者,其中藏族80人,汉族72人;另外135位腹部超声未见明显异常的体检者作为对照组,其中藏族61人,汉族74人。
学位
目的:探讨经腹腹膜前腹股沟疝修补术(TAPP)与李金斯坦术(Lichtenstein)治疗腹股沟嵌顿疝对术后并发症、急慢性疼痛及术后生活质量的影响。为临床治疗腹股沟嵌顿疝选择合适术式、评估预后提供参考。资料与方法:根据纳排标准,选取2019年10月至2021年10月在青海大学附属医院接受手术治疗的腹股沟嵌顿疝患者70例(手术均为我院高年资医师完成)。术式根据患者病情和适用条件进行选择,分为Lich
学位
土体动力响应问题与工程建设安全存在密切关系,一直是工程界关注的重要研究课题。以往对土体动力响应问题的研究大多将土介质视为单相弹性或两相饱和多孔介质,对于更加符合实际的非饱和土动力响应问题的研究较少。此外,大部分对土体动力响应问题的研究都是基于土体各向同性并且均匀的假设,然而在自然环境下的土体具有非均匀性。因此,研究荷载作用下非均匀非饱和土地基的动力响应问题更具实际意义。本文基于三相多孔介质混合物理
学位
学位
目的:研究持续性房颤患者在服用沙库巴曲缬沙坦钠片(ARNI)与厄贝沙坦片后对患者心脏结构、功能及心肌纤维化相关指标的影响,为心房颤动患者在抗心肌纤维化治疗方面提供一定的理论依据。方法:收集青海省人民医院2020年10月1日到2021年9月1日63例诊断为持续性心房颤动患者,分为观察组(n=31)和对照组(n=32)。观察组和对照组患者分别给予口服沙库巴曲缬沙坦钠片及厄贝沙坦片治疗,根据血压及患者耐
学位
目的:通过比较微波消融(microwave ablation,MWA)与根治性肝切除术治疗直径≤5cm的早期肝泡型棘球蚴病(hepatic alveolar echinococcosis,HAE)基本临床资料,探讨两种治疗方式有无疗效差异。方法:回顾性分析2014年6月至2020年1月在青海大学附属医院被诊断为HAE的患者,按纳入及排除标准收集患者的一般临床资料,采用倾向性评分匹配(propens
学位
目的:SMAD4缺失或表达异常与肿瘤发生和耐药密切相关。SMAD4突变和SUMO化等翻译后修饰影响SMAD4的表达水平和活性。本论文旨在阐明SMAD4调控肺腺癌患者A+T治疗耐药相关性。方法:本研究利用肺腺癌病人肿瘤组织标本,通过基因测序和组化染色的方法检测了标本中突变基因以及SMAD4的突变和表达情况。收集符合本研究入排标准的肺腺癌患者176例EGFR突变的局部晚期/晚期NSCLC患者,样本进行
学位
近年来,区块链在数字金融、信息共享等领域发展迅速,为传统行业带来了诸多变革。然而在传统区块链中,每个参与共识的全节点都必须存储完整的区块链数据,这使得存储资源有限的节点无法加入区块链,严重制约了区块链的广泛应用。因此区块链存储扩容成为了当前的研究热点之一。在现有的研究成果中,基于编码的链上方案是一类较优的方法,其可以在保障数据安全的前提下,有效降低区块链节点的存储压力,但仍存在恢复开销较大、跨节点
学位
雾是大气中散布的粒子极大的吸收散射光线的一种自然现象。受大雾天气影响,成像设备实际获取的图像经常存在图像模糊、对比度低、色调偏移等图像质量下降问题。因此,如何实现一种良好的单幅图像去雾方法已成为研究的热点。最近由于生成对抗网络在图像去雾上的成功实践,怎样设计合理的网络模型及损失函数是当前亟待解决的问题。本文在总结现有的去雾技术和相关研究的基础上,采用生成对抗网络对图像进行去雾研究。论文的主要工作如
学位
指针仪表是数据采集、数据监控、数据记录等多种场景下必不可少的工具,对于生产生活有着重要的意义。使用数字图像技术智能读取指针仪表读数可以减少人力成本,降低恶劣环境下读表难度、危险度,提高读数准确度和实时性,具有很大的实用价值。指针仪表的种类繁多、场景光线变化、拍摄图像中存在仿射变换等问题给指针仪表自动读数工作带来了很大的困难。针对预测指针方向的问题,本文在目标检测网络(YOLOv5)的基础上设计了旋
学位