基于异质信息网络元路径的药物-靶标相互作用预测模型

来源 :北京大学学报(自然科学版) | 被引量 : 0次 | 上传用户:huandakedi222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种融合元路径信息的图神经网络模型,用于预测药物-靶标相互作用(GMDTI).首先根据8个数据集中的药物、靶标、疾病和副作用数据以及它们之间的8种作用关系,构建药物-靶标异质信息网络(HIN);然后定义两条元路径来捕获药物-靶标HIN中的不同子结构信息和不同节点间隐藏的语义信息,并应用图神经网络的方法聚合节点的一阶邻居信息和元路径中节点间的语义信息;最后利用端到端的学习方法完成DTIs预测.该方法同时考虑药物-靶标HIN的结构特性和元路径语义信息,有助于学习到更多潜在的药物-靶标作用关系.实验结果表明,GMDTI的预测准确率高于所有基线模型,AUC达到98.6%,AUPR达到94.5%.同时通过调整数据的稀疏度和降噪实验,证明GMDTI具备优于所有基线模型的鲁棒性.
其他文献
水痘-带状疱疹病毒(Varicella-zoster virus,VZV)是引起水痘和带状疱疹这两种临床表现不同病症的共同致病原,其基因组中ORF43是VZV在宿主细胞中复制的必需基因,但目前尚无针对VZV ORF43编码蛋白性质与功能的研究报道.本研究目的 是制备抗VZV ORF43单克隆抗体,以初步研究该蛋白在细胞内的表达与分布情况.本研究构建了VZV ORF43蛋白的原核表达质粒并在大肠杆菌中进行了该蛋白的表达,纯化蛋白免疫小鼠后,使用杂交瘤技术及克隆化筛选,获得一株特异性强、反应性好的抗VZV O
为了对知识库(KBs)进行补全,提出一种新的基于路径的推理方法,使用注意力机制,将实体与其类型相结合,共同对路径中的实体进行表示,并使用注意力机制对每条路径预测的关系向量与给定关系的表示向量之差的绝对值进行汇总来计算模型的置信度.在基准数据集WN18RR和FB15k-237上的实验结果表明,与现有的基于路径的关系推理方法相比,所提方法具有更好的性能.
为建立小鼠轮状病毒(Rotavirus,RV)感染动物模型,研究可同时表达轮状病毒NSP4 (Nonstructural protein 4)和VP7(Viral protein 7)的重组腺病毒疫苗免疫孕鼠后对新生乳鼠感染RV的被动保护作用.新生乳鼠口服异源株轮状病毒Wa、ZTR-68或SA11株后(分2次给予,每次含5×104 CCID50的RV),观察乳鼠是否有腹泻症状、肠道病理变化,检测乳鼠粪便排毒百分率;另以重组腺病毒rAd-NSP4-VP7免疫孕鼠后,检测母鼠血清抗体产生情况,并对比乳鼠粪便中
针对当前自动问答数据增强方法需要大量外部数据的问题,提出一个面向问答模型缺陷的数据增强方法.首先,在训练集上训练好问答模型、问题生成模型以及问答匹配模型;然后,获取问答模型在训练集上预测的所有答案,并选取其中预测错误的答案;再后,使用问题生成模型对这些答案生成相应问题;最后,通过问答匹配模型对生成的问答对进行过滤,保留其中质量较高的数据作为最终的增强数据.该方法不需要额外的数据与领域知识,同时能够针对模型构造特定数据,耗费较少的训练代价就能使模型性能提升.实验结果表明,所提出的数据增强方法对R-Net,B
在前期基于图网络的模型基础上,引入角色指代信息,提出融合角色指代的多方对话关系抽取模型.在构建图节点时加入角色节点,将其与对应角色指代的词节点进行连接,并使用图注意力网络进行编码.在DialogRE数据集上的实验效果与基线模型相比,F1值在验证集上提升2.9%,在测试集上提升4.6%.
探索将XLM-R跨语种预训练语言模型应用在神经机器翻译的源语言端、目标语言端和两端,提高机器翻译的质量.提出3种网络模型,分别在Transformer神经网络模型的编码器、解码器以及两端同时引入预训练的XLM-R多语种词语表示.在WMT英语-德语、IWSLT英语-葡萄牙语以及英语-越南语等翻译中的实验结果表明,对双语平行语料资源丰富的翻译任务,引入XLM-R可以很好地对源语言句子进行编码,从而提高翻译质量;对双语平行语料资源匮乏的翻译任务,引入XLM-R不仅可以很好地对源语言句子进行编码,还可以对源语言端
柯萨奇病毒A9型(Coxsackievirus A9,CVA9)是常见的人类肠道病毒血清型,其感染可引起无菌性脑膜炎、脑炎等疾病.为探索其进化遗传学特征,本研究对山东省1991-2018年CVA9分离株的VP1完整编码区进行了序列测定,并与GenBank中获得的全球序列一并进行系统发生学和进化遗传学分析.结果 显示全球CVA9可分为Ⅰ-Ⅻ 12个基因型,优势基因型为Ⅶ,包括山东株在内的所有中国分离株均属于该基因型.进化遗传学研究显示,CVA9 VP1区序列的每年每个碱基的平均进化速率约为6.25×10-3
高危型人乳头瘤病毒(Human papillomavirus,HPV)持续感染可导致癌前病变,以HPV-16/HPV-18型感染最为常见,但HPV感染所产生的中和抗体(Neutralizing Antibody,nAb)对宫颈癌及癌前病变的相关关系尚不明确.本研究旨在探索HPV-16/HPV-18在不同的中和抗体与DNA感染状态下的年龄分布及其和宫颈组织学病变的相关性.通过横断面研究,本研究于2012年11月至2013年4月招募7372名18~45岁健康女性.收集每个受试者血清用假病毒中和抗体定性检测HP
人类免疫缺陷病毒(Human immunodeficiency viru,HIV)包膜糖蛋白gp120具有神经毒性,可引起神经元损伤,与HIV相关性痴呆的发生有关,但gp120引起神经元损伤的机制尚不清楚.有研究报道gp120能够引起神经元出现线粒体功能障碍,而PGC-1α是促进神经元内线粒体生成的关键基因.因此,本研究将分析PGC-1α基因在HIV-1包膜糖蛋白gp120诱导神经元线粒体功能障碍中的作用及机制.原代培养皮层神经元细胞后分为对照组、gp120组、空白质粒组、gp120+空白质粒组,gp12
针对当前神经机器翻译在捕捉复杂句内小句间的语义和结构关系方面存在不足,导致复杂句长文本翻译的篇章连贯性不佳的问题,提出一种融合小句对齐知识的汉英神经机器翻译方法.首先提出手工和自动相结合的标注方案,构建大规模小句对齐的汉英平行语料库,为模型训练提供丰富的小句级别的汉英双语对齐知识;然后设计一种基于小句对齐学习的神经机器翻译模型,通过融合小句对齐知识,增强模型学习复杂句内小句间语义结构关系的能力.在WMT17,WMT18和WMT19汉英翻译任务中的实验表明,所提出的方法可以有效地提升神经机器翻译的性能.进一