基于药靶作用信息的自编码及亲和度关系预测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:shuo19871108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质作为生命活动的主要承担者,其与化学分子的相互作用特性对潜在药物分子的发现和开发具有极大的意义。传统的药物开发手段依赖专家经验和大量的生化实验筛选,其巨大的成本对新药开发带来了极大的障碍,所以近年来利用计算手段和人工智能促进对潜在药物分子的筛选乃至生成得到了极大的关注,并有潜力对药物开发起到加速和降低成本的作用。作为最热门的生成式框架之一,变分自编码器(Variational Autoencoder,VAE)已知会受到后验失效现象的影响,即其隐空间变分分布会崩塌为先验分布,尤其是当解码器能力非常强的时候。在这个工作中,我分析了后验失效的变分自编码器生成的隐空间表示,并提出了一个新的变分自编码器的变种,NE-VAE,显式地约束编码器把输入空间中比较近的样本点编码到隐空间中较近的位置。可以观察到对于不同的VAE变种,即使给出了相似的ELBO,KL散度甚至互信息指标,同样可能产生行为上非常不同的隐空间组织。在实验中,NE-VAE可以产生与之前的模型产生的隐空间表示有质的不同,并保持绝大多数隐空间维度的活跃性,这可能对后续的下游任务有有利的影响。与相关工作相比,NE-VAE可以更好地防止后验失效的发生,并且可以很容易地嵌入到任何一个变分自编码器的框架中,同时不需要引入额外的模型部件和复杂的训练流程。除此之外,本工作对NE-VAE模型的隐空间优化性能做了一定测试,结果优于现有模型。同时使用NE-VAE方法生成的关系嵌入进行药靶亲和度预测性能显著优于现有工作。
其他文献
自毁聚合物是一种独特的大分子,通常是指在受到外界刺激时能发生端到端解聚的聚合物。自毁聚合物这种独特的性质使得它在瞬态器件、药物传递等领域有很多实际的应用。聚邻苯二甲醛(PPHA)是自毁聚合物中的重要一种,它的聚合上限温度(Tc)为-43℃。PPHA的低Tc且对酸高度敏感的特性,使得它在室温下就能快速完全解聚。除此之外,PPHA还具有易于合成的优点,因此受到了研究人员的青睐。然而,PPHA较差的力学
近年来,由于氢气具有燃烧热值高、来源丰富、运输和储存方便、反应产物绿色无污染的优点,氢气作为一种清洁能源被广泛应用。电解水制备氢气过程中,阳极析氧半反应所需电压高,耗能较多,因此为了降低电解水过程中的能源消耗,选择合适的析氧反应催化剂至关重要。金属有机骨架材料凭借其孔隙率高、结构易于调控等优势成为最有可能取代贵金属催化剂的材料。但是为提高金属有机骨架材料导电性通常需要进行热处理,工艺复杂。本文通过
建设地方政府的投融资平台能够有效缓解政府财政紧张问题,促进地方经济的进一步发展。围绕这一问题,本文对地方政府建设投融资平台的作用进行分析,并提出了相应转型措施。
RNA修饰普遍存在于真核生物中,包括RNA甲基化、乙酰化、尿苷化等,在目前已经鉴定出来的150多种RNA修饰中,N6-甲基腺苷(m~6A)所占的比例最大。RNA甲基化主要发生在RRACH的基序中,富集于3’UTR、终止密码子周围和内部的长外显子中,RNA甲基化也存在于前体RNA(pre-RNAs)和长链非编码RNA(lncRNAs)中。在RNA甲基化的调控过程中,主要由三个核心组分进行调控,分别是
藻蓝蛋白(C-phycocyanin,C-PC)是一种具有极高商业价值的亮蓝色荧光蛋白,因其具有抗氧化、抗菌、抗炎、具荧光等特性而被广泛应用于营养保健、制药、食品和化妆品等领域。C-PC的价值往往随其纯度的提高而增加,然而,C-PC对一些外在条件如光、温等敏感易降解,因此,如何快速高效的获得高纯度的C-PC具有重要的意义。三相萃取技术(Three-phase partitioning,TPP)是一
“十四五”强调了持续改善水生态环境的重要性,提出了以水生态环境质量为核心,污染减排和生态扩容两手发力,统筹水资源利用、水生态保护和水环境治理的“三水”统筹新思想。阿什河作为松花江的一级支流,地处我国东北地区东部,流域健康状态受季节影响严重,低温低流对阿什河流域冬季的水资源、水环境、水生态都造成了显著影响。本研究基于“三水”统筹背景,按照“流域统筹、区域落实”的思路,对阿什河流域展开水生态功能分区时
在大肠杆菌中,核糖体结合分子伴侣TF是新生肽链遇到的第一个分子伴侣,它在新生肽链在核糖体上的折叠阶段中具有重要作用。研究发现TF中各结构域都有着重要的功能,N结构域中包含与核糖体结合的位点,C结构域中包含与新生肽链结合的位点,P结构域具有肽酰顺反异构酶活性,具有辅助结合位点,所以P结构域是不可或缺的活性结构域。但TF各结构域的功能对大肠杆菌生理状态的影响并不清楚。因此,为了研究TF各结构域的功能,
环境噪音是生态系统的重要组成部分,会影响自然界中的生物种群数量,因此有必要在确定性的生物种群模型中考虑环境噪音的随机扰动影响,把随机微分方程作为工具,来研究生物数学里的重要课题。对随机生物模型来说,模型的持久性、灭绝性和渐近稳定性等性质受国内外学者的广泛关注,本文主要讨论几类随机生物种群模型以及相关模型解的动力学性质。本文的主要研究内容分为两部分。第一部分是针对建立的单种群随机生物模型,得到其解的
内侧内嗅皮层MEC作为海马和新皮层的媒介结构,在空间导航、工作记忆等有重要作用,MEC深层与浅层间相互协作行使功能。浅层主要向海马进行输出,而深层接收来自海马的输入,不同位置的神经元执行的功能不同。目前已有研究表明,胆碱能对MEC的投射区域是具有靶向性的,胆碱能能够调节神经元的某些电生理性质。但目前关于MEC中不同位置的神经元的细胞特性是否会受到胆碱能的不同调控作用还未有系统性的研究。本课题的目的
轮胎的耐磨性由轮胎结构和材料本身的性能决定,传统的橡胶材料配方设计并没有考虑轮胎结构对于磨耗性能的影响,轮胎企业中对橡胶材料的阿克隆磨耗测试结果无法与轮胎结构磨耗量关联,本文通过对轮胎结构进行特性分析,获得橡胶材料性能与轮胎磨耗性能的关系,进而对橡胶材料组分进行优化。建立了子午线轮胎与地面接触的有限元模型,分析了胎面橡胶材料性能对轮胎接地特性影响。仿真结果表明:随着胎面橡胶弹性模量增加,摩擦功、纵