基于概率关系自编码器的药靶关系预测研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:chenzhe1987827
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物的设计与研发是依据对生物靶标和分子活性的知识寻找有效治疗药物的过程。药物小分子大多是一种有机小分子或化合物,它通过激活或抑制生物分子功能,对多种被称为靶标的蛋白质产生特殊的影响,从而对疾病产生治疗效果。药物与蛋白质靶标之间的相互作用在药物研究中具有重要意义,如促进药物发现过程、药物副作用预测和药物再利用等。最初的研究方法主要采用临床生物实验方法,保证了实验结果的有效性。而实验中想找出与目标靶蛋白有结合作用且具有高亲和力的化合物是很具有挑战性且成本昂贵的过程,这就需要开发设计出更有效和更高效的生物计算方法来预测药物-靶标的相互作用。生物计算方法能够从积累的大量数据中挖掘出潜在特征。同时,计算方法的预测结果能够使生物实验更有针对性,节约成本。目前用于预测药物靶标关系的计算方法主要分为三类:(1)基于配体的预测方法;(2)基于靶标的预测方法;(3)机器学习方法。基于配体的预测方法通常用于蛋白质的三维结构信息未知时,依赖于配体的结构和活性之间的关系设计发现药物。基于靶标的方法可以获得较为精确的结果,但是需要有蛋白质靶标的三维结构,通过计算模拟出药物和蛋白质结合的空间大小,形状和结合样式,进而预测药物和靶标之间的结合亲和力。机器学习方法尤其深度学习技术在各个领域取得不错的效果,越来越多的研究者使用机器学习方法在药物靶标关系预测问题上提出了很多创新性的思路。基于上述说明,本文提出了一种基于概率图模型的方法,设计了对应的变分自编码器用于预测药物靶标关系。根据数据集的特点,设置了两类对比实验:结合关系预测和结合亲和力预测。我们在几个常用数据集上做了不同的实验对比,结果显示,我们的方法在各个实验中都有不错的表现,甚至在一些实验中达到最优的结果。另外,利用概率图模型的特性,后续工作中还可以扩展我们的方法,使得模型对于给定的蛋白质,能够直接计算出与其结合的药物特征。
其他文献
显性和隐性知识一直是心理学和二语习得研究的重要课题,而对这两类知识的测量是开展相关研究的首要任务,也是制约相关研究进展的重要因素。追述口头报告、直接-间接测试和主
内镜超声(endoscopic ultrasonography,EUS)技术经过许多同道多年来的不懈努力,在国内得到了较好地推广,已成为内镜领域重要的前沿技术,其临床应用范围也越来越广,为多种消化
本研究探讨中国人群Landsteiner—Wiener(LW)血型基因的多态性。随机采集深圳市血液中心160名非血缘关系无偿志愿捐血者外周血样EDTA抗凝血标本,并提取DNA。对这160例DNA标本直
随着科技的发展,现今时代需要传播和存储的信息越来越多,信息传播的载体也发生了极大的变化。从图书馆的出发点来看,传统图书馆目前的发展模式很明显已经不能满足现在的需求,
改革开放后,随着西方政治精英主义思想的在国内传播,中国学术界开始对精英政治加以阐释和反思.国内对精英政治问题的研究主要集中于对精英和精英政治的界定、精英政
期刊
段玉裁在古今字研究方面,不仅有理论上的详细说明,而且实践上也提供了丰富的例证.他对古今字进行了开创性的研究并取得了重大成绩,但与此同时,其研究也存在着缺撼和不足.
详细介绍了现场总线中已得到广泛应用的基金会现场总线(FF)在自控工程设计和管理服务软件(SmartPlant Instrumentation)中的应用。包括FF仪表定义、FF仪表创建、FF仪表接线等多方
本文认为古今字的实质是汉字的孳乳分化,古今字实际上就是区别字。古今字与古今语,一是文字问题,一是词汇问题,是两种不同的语言现象。异体字中的一部分与古今字有相似之处,
目前咖啡文化在高校中掀起热潮,各大品牌咖啡馆争相进驻高校。在高校随处可见手持咖啡杯的学生,显然咖啡文化正逐步悄然的渗入校园。然而,这些咖啡馆大都功能单一,并普遍以盈
少儿节目发展至今,除了在节目类型上不断更新外,在内容和呈现方式上也发生了巨大的变化,如今优秀的少儿节目更强调参与体验感,更强调电视观众的代入感,更强调多元素融合。“