【摘 要】
:
识别药物-靶标相互作用(DTI)是药物发现中的一项关键任务,在虚拟筛选、药物重定位等领域都发挥了至关重要的作用。尽管生物实验方法是识别DTI最可靠的方法,然而该方法存在成本高、耗时长的问题。为了提高识别DTI的效率,随着药物与靶标相关数据的大量增长以及计算机技术的快速发展,许多研究人员致力于利用机器学习方法预测潜在的DTI。这些方法通常将预测DTI的问题视为二分类任务或回归任务,每个药物-蛋白对都
论文部分内容阅读
识别药物-靶标相互作用(DTI)是药物发现中的一项关键任务,在虚拟筛选、药物重定位等领域都发挥了至关重要的作用。尽管生物实验方法是识别DTI最可靠的方法,然而该方法存在成本高、耗时长的问题。为了提高识别DTI的效率,随着药物与靶标相关数据的大量增长以及计算机技术的快速发展,许多研究人员致力于利用机器学习方法预测潜在的DTI。这些方法通常将预测DTI的问题视为二分类任务或回归任务,每个药物-蛋白对都有一个标签来指示药物与蛋白之间是否存在相互作用关联。尽管有许多基于机器学习的方法被提出,当前仍存在一些挑战。首先,有监督的机器学习方法需要正、负样本进行训练,然而实践中负样本往往缺失,大多数研究仅通过从未知关联中随机选取负样本以解决这个问题。其次,如何有效利用药物与靶标相关的多源信息以提高预测性能也是该领域的一个主要挑战。鉴于此,本文主要开展了如下工作:(1)发现了从未知关联中随机选取负样本时可能会引起过于乐观的预测率的两类隐藏偏倚,在多个预测方法上进行实验并验证了这两类隐藏偏倚的存在。然后,根据隐藏偏倚的特点,提出了避免这两类隐藏偏倚的相应方法。进一步地,提出了一个基于药物-蛋白-疾病异构网络中的最短路径长度选取可靠负样本的方法并构建了DTI数据集。该方法的理论为,在包含多种关联的药物-蛋白-疾病异构网络中,药物与蛋白之间的最短路径越长,它们之间越不可能发生相互作用。此外,根据化合物(候选药物)与蛋白(候选靶标)之间的结合亲和力值划分正、负样本,构建了化合物-蛋白相互作用(CPI)数据集。(2)提出了一个DTI预测框架HNGO-DTI以集成药物-蛋白-疾病异构网络中的拓扑信息和蛋白的基因本体(GO)注释信息。首先,计算药物的Pub Chem指纹与蛋白的KSCTriad描述符作为初始特征,并通过全连接(FC)层生成其低维表示。然后,从异构网络中删除了所有的预测目标关联(即已知的DTI关联),并利用异构图神经网络(HGNN)从药物-蛋白-疾病异构网络中提取药物和蛋白的拓扑特征。此外,利用在GO术语相似性网络和GO术语-蛋白二分网络上的图神经网络(GNN)提取蛋白的GO注释特征。最后,利用深度神经网络(DNN)预测潜在的DTI。实验结果表明,该方法具有较好的预测性能。(3)提出了一个DTI预测框架DFDTI以融合不同类型的结构描述符。首先,计算了药物与蛋白的多种结构描述符作为初始特征,并通过FC层生成其对应的低维表示。然后,考虑到不同类型的描述符对于DTI预测的贡献度不同,利用通道注意力机制给予不同的描述符权重。此外,利用单层Transformer编码器来增强描述符的特征表示。最后,通过DNN预测潜在的DTI。实验结果表明,该方法具有较好的预测性能。(4)提出了一个基于集成深度学习的DTI预测框架EDDTI。首先,计算了药物和蛋白的多源相似性作为初始特征。然后,将所有单一药物特征和单一蛋白特征的组合输入不同的DNN中以单独训练多个基学习器。最后,结合所有基学习器的预测结果作为最终的预测结果。此外,为证明该方法的可扩展性和优越性,还以药物描述符和蛋白描述符作为初始特征,构建了一个EDDTI的变体预测框架EDDTI-d。实验结果表明,该方法具有更好的预测性能。综上,本文研究了如何构建可靠的数据集,并基于深度学习构建了三个DTI预测模型,且均取得了良好的预测性能。本文旨在为识别DTI提供帮助,从而提高药物发现的效率。
其他文献
新时期,国土空间规划体系建设对城乡规划的实施评估提出了更高的要求,对涉及历史文化空间的各类历史文化保护利用类规划开展实施评估的必要性也随之提升。在此背景下,考古遗址公园作为城市承载历史文化资源的重要国土空间,对其开展规划实施评估的研究具有重要的理论和实践意义。西安作为国内考古遗址公园建设的领先城市,自2010年首批国家考古遗址公园挂牌成立以来,先后创建国家考古遗址公园四处。汉长安城未央宫国家考古遗
虚拟现实和航拍遥感等领域对图像有宽视场和高分辨率的要求,将有重叠区域的多幅图像拼接为一张图像是满足此要求的一种常用手段。基于特征的图像拼接对图像的尺度、旋转和平移具有不变性,是目前图像拼接领域的研究热点,其主要步骤包括:图像的特征提取与描述、特征点匹配、重投影拼接和图像融合等。基于特征的拼接算法的硬件实现较复杂,目前实现高效的实时图像拼接系统仍具有重要的研究意义。为了解决上述问题,本文设计了一个基
本文旨在通过厘析此在(Dasein)概念的多维起源,澄清海德格尔此在概念的意义内涵。第一章主要阐明此在概念澄清的重要意义及学界当前研究情况。第二章尝试追溯此在(Dasein)概念的思想起源。笔者认为,在《存在与时间》之前,存在四种此在概念的思想来源:1.实在性问题和有效概念使海德格尔在逻辑上确认了存在论分析的“真”。海德格尔在对实在性问题的梳理和批判中隐含着对此在“世界”真实性的确认,同时在对心理
中国人口老龄化已经成为不可避免的趋势,同时也给经济发展和社会发展带来了诸多问题。预计到2050年,中国老年人口将突破4.5亿,到那时每三个人中就会有一个人是老年人。中国老龄化呈现出未富先老、城乡养老资源差异大的状况,我国养老的关键及重心在农村,突破口也在农村。农村养老基础设施不健全、养老政策不完善,导致老年群体很难在农村得到充足的养老资源。我国虽然近几年各界都在关注养老问题,自我养老、家庭养老、社
新中国成立至今,我国不断探索符合时代发展需求的乡村治理模式。建国初期,在国家优先发展重工业的战略背景下,农村实行高度集权的“政社合一”治理模式。上世纪末,国家推行家庭联产承包责任制,在乡村治理上建立了以“村民自治”为重要特征的“乡政村治”模式。随着市场经济深入发展,农村空心化日益严重,村“两委”矛盾逐渐加剧。为强化农村基层党组织和党员在乡村治理中的作用,党的十九大召开以来,中共中央在不同文件、政策
目的探讨米诺环素辅助龈下刮治联合根面平整术对侵袭性牙周炎(AgP)龈下菌斑中牙周致病菌的影响。方法选取2019年3月—2021年3月南开大学口腔医院收治的AgP患者206例作为研究对象,按照随机分组方法分为研究组和对照组,每组103例。对照组行龈下刮治联合根面平整术常规治疗,研究组在对照组基础上给予米诺环素辅助治疗。记录两组临床疗效,比较两组治疗前后牙周指标、炎症因子及牙周致病菌检出情况及不良反应
随着城市的快速发展,污染物排放超过环境容量,导致城市河流污染,水生生物数量减少、河流生态系统结构和功能严重退化,日积月累,形成大量黑臭水体,黑臭河流的富营养化严重威胁着城市居民的健康和生态安全。因此,对黑臭水体进行治理也逐渐成了当今城市面临的一个切实问题。水体的自净能力具有局限性,黑臭水体问题上,需要采取相应的人工干预措施,才能进行有效治理。常见的治理方式有物理净化、化学净化、生物净化等。本文首先
为研究高速轻载工况下兜孔形面几何参数对V形兜孔圆柱滚子轴承保持架磨损性能的影响,建立了考虑兜孔处润滑影响的轴承动力学模型。以基于Masjedi磨损模型的时间平均磨损率作为磨损性能的评价标准,研究了兜孔形面几何参数对V形兜孔保持架磨损性能的影响规律,分析了在不同转速下兜孔壁倾角均为15°的V形兜孔保持架的磨损性能及打滑特性。结果表明:兜孔形面几何参数对保持架的磨损性能影响显著,通过对其优化可有效提升
体验时代互联技术盛行、消费结构升级、疫情常态化使实体书店的影响力降低,发展开始滞后,实体书店发展迎来了新的挑战;而国家政策支持、全民阅读计划的推行、文化强国远景目标的提出又为实体书店提供了发展机遇。本文立足于我国实体书店发展的挑战与机遇,综合运用了经济学、设计学、心理学等学科专业理论,并结合文献研究、案例分析、跨学科研究等方法以及体验经济的特征,分别从实体书店品牌设计现状与时代特点、再设计在实体书
基于传统算法的无人机目标定位系统精确度较低且容易受到光照条件干扰,针对该问题提出了一种基于嵌入式视觉的无人机目标定位系统。使用深度可分离卷积替换YOLOv2原始模型中的Darknet-19骨干网络,大幅减小模型体积;引入RepVGG模块提取复杂特征,以提升检测精度。将模型部署到嵌入式端并进行了性能测试,结果表明改进YOLOv2算法的网络模型检测精度达到了96.7%,检测速度达到25 fps,解决了