多视角的药物分子表示方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lr78
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新药研发是一项耗资巨大且周期漫长的系统工程。获得合适的分子表示是人工智能驱动的药物设计和发现的关键问题。常见的方法将分子表示为SMILES字符串、图、分子指纹等形式。这些方法通常视重原子(相对原子质量大于氢原子)为基本单位或是视整个分子为基本单位。但一个事实是,分子的许多性质是由某些特定的子结构所决定的。分子指纹包括了一些子结构的信息,但分子指纹并不具有分子的完整信息。例如子结构之间的空间关系就无法体现在分子指纹中。不同的分子可能得到相同的分子指纹。因此,需要一种更合理的分子表示。本文提出一种表示分子子结构特征的方法,通过数据驱动与人工知识相结合的方法,将分子表示为若干子结构。比起分子指纹或是一维分词等方法,所得到的子结构更接近真实的化学空间。为了编码分子中的子结构特征,本文提出一种基于子结构的分子编码器,在图神经网络的基础上添加子结构信息。该模型将特定子结构嵌入为向量,并结合进分子中对应原子的表示。图神经网络的预训练方法可被应用于分子图。特定子结构的嵌入可利用大量的无标签数据预训练得到。能够利用子结构信息的图神经网络可被用于下游任务,但该方法得到的是关于分子的局部信息。通过计算MOE(Molecular Operating Environment)中的分子描述符,就得到了关于分子的整体信息。本文提出了结合局部信息与整体信息的模型,在分子属性预测、ppi下游任务上测试方法的效果。
其他文献
松辽盆地X区块位于松辽盆地南部,整体为西北倾的单斜构造,储层以三角洲前缘水下分流河道及河口坝为主,相变较快,非均质性较强。X区块是松辽盆地南部重要的效益区块,随着油田开发程度的加强,搞清砂体连通关系、明确储层分布成为了油田寻找剩余油的关键问题之一。针对上述问题,本文选择X区为研究靶区,以地震地层学为指导,采用封闭骨架剖面逐级验证技术,精细统层对比完成高分辨率层序格架的建立;利用区内详实的测井资料,
学位
近年来,地震勘探技术不断发展,但受限于深层地震地质条件复杂、埋藏深,地震资料成像难度一直较大,信噪比和分辨率难以得到保证,开展目标精细刻画难度较大。为加强松辽盆地北部深层天然气勘探,本文主要针对营城组火山岩储层开展研究。本文运用可视化技术、相干体技术、以及与地层倾角和边棱检测技术有机结合的技术手段进行断层解释,对小断层及微幅构造进行精准识别,以科学合理的断层组合,使断层解释成果更加可靠、准确;采用
学位
随着我国综合国力的大幅提升,人民群众对美好生活的需求正日益提高。大数据和人工智能技术的迅速发展,使得推荐算法在互联网服务中得到了广泛的应用。传统的推荐已不能够满足用户的多样化需求,亟需更具个性化的服务推荐算法的提出。服务推荐需要数据支撑,而知识图谱中含有的海量数据和知识,能够更好地辅助推荐系统的运行。知识图谱可以看做是一种多领域、综合性的知识库,最大程度地体现数据关系和数据属性。那么,为了满足用户
学位
研究区为阿尔凹陷南部南洼槽沙麦-罕乌拉构造带。前人对于阿尔凹陷的研究主要集中在哈达、哈达北和北洼槽,阿尔凹陷北部勘探程度高,南部勘探程度低。研究区构造上横跨沙麦和罕乌拉背斜,其构造演化过程与阿尔凹陷整体构造演化相一致但又有所不同。由于不同时期和不同方向的区域应力对凹陷共同作用,导致研究区在构造演化上具有多期构造沉降、多期构造反转交互进行的特征。本文针对阿尔凹陷南部井资料少、地质认识不够深入的实际情
学位
葡362区块是松辽盆地大庆长垣中浅层扩边、增储的重点区块之一,葡萄花油层为研究区内主要的含油层系。葡362区块处于三肇凹陷永乐向斜向大庆长垣敖包塔背斜过渡处,其整体表现为构造特征多样、油水特征复杂和储层薄窄的特征,上述地质特征导致近年来新钻井成功率较低。因此,深入探究研究区葡萄花油层的油气成藏规律对老油田持续增储和稳产具有重要意义。本文利用研究区内钻井、岩心、测井和三维地震等资料,运用储层沉积学及
学位
走滑断裂对于油气圈闭的寻找具有重要的指导作用,小微断裂的发现与解释为油气勘探提供了新的方法,但是由于缺乏能够有效厘定走滑断裂连通状态的定量表征,导致部分实际生产过程失利。本文以沙垒田凸起的多条NE向雁列式走滑断裂带为研究对象,解析其几何学与运动学特征分析发现这些断裂带由晚期右旋走滑作用形成。以此设计系列性砂箱构造物理模拟实验的结果表明:厘定雁列式走滑断裂连接程度的定量表征只与雁列式断裂最大断距(D
学位
随着计算机技术的飞速发展,机器翻译系统取得了飞速的发展。对于尚不完美的机器翻译译文,自动评估技术是模型进一步优化和系统应用过程中不可或缺的技术。翻译质量在仅使用源语言和由翻译系统得到的机器译文的情况下便能够对译文的质量进行评估,因此在无参考译文的情况下被广泛使用。句子级翻译质量评估的目的是预测机器翻译的后期编辑工作量,这一工作量由HTER表示,即所需编辑(插入/删除/替换)次数与参考翻译的长度之间
学位
无论从历史事实还是教育史研究的角度,美国“教育民权运动”都可以被视为一场相对独立的教育运动。争取教育平权是撬动和推动民权运动的巨大力量,从政治家长久以来的政治抗争和法律斗争以争取外在的教育平等权利,到教育活动家克拉克等人的教育实践以推动弱势群体的内在教育赋权增能,二者相辅相成,最终对美国黑人及少数族裔的教育生态产生了重大的影响,并推进了美国社会文明化的进程。
期刊
探寻卓越小学教师核心能力及其培养是时代之需,符合教师教育的内部规律。卓越小学教师的核心能力充分体现为“四能”,即践行师德能力、胜任教学能力、有效育人能力和主动发展能力。通过“四维”(即导向职业认同的师德养成、基于学习共同体的师能提升、依托CCEP的育人智慧培育和立足PBL的发展能力培养)促进卓越小学教师核心能力的培养。在培养过程中,关键要通过教师教育治理结构的重构实现高校、政府、社会和中小学的协同
期刊
全面、及时地了解供水管网的工作状况至关重要,是供水企业制定科学、经济、合理的供水规划的前提和基础,直接影响供水企业的运营和发展。利用具有整合资源、操作简便、时效性高、贴合运行现状等特点的在线实时水力模型,能够区域化、可视化、一体化地宏观评估管网的实时状态,模拟多种工程方案,从而比选、确定满足条件的最优供水规划。在新建水厂输水管、新建单元配水管、新建区域联络管3种供水规划场景中应用在线实时水力模型,
期刊