基于图神经网络的计算药物重定位研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ziyi1965
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新药研发费力、耗时且费用高昂。过去几十年,大量资金投入到药物研发中,有一定成效,但远不能满足当前的社会需求。药物重定位这一方法旨在缩短药物研发时间、降低研发成本,减少失败。随着技术发展,研究人员可以根据实际需求生成大量组学数据。有了数据基础,药物重定位也进入了大数据时代-计算药物重定位,结合组学数据开发算法模型进行药物-疾病关系预测。随着研究的深入,对药物作用机理有了更深层次的理解,药物主要通过靶点、基因和蛋白质等作用于疾病,这种数据结构不同于传统的欧式空间数据。传统的神经网络能较好解决欧式空间数据问题,在研究这种节点化数据特征中作用有限,图神经网络是目前针对节点数据进行数据分析的最优框架,能有效解决该问题。本文的主要工作是基于图神经网络开发药物重定位模型,具体工作如下:(1)整理组学数据。通过Drugbank、Gene Ontology、DisGeNET等组学数据库收集整理得到药物-疾病、药物-靶点、疾病-基因、蛋白质-蛋白质和蛋白质-生物功能相互作用关系数据集,并进行了预处理用于后续实验。其中,生物功能是生物信息学研究中一类重要数据,在计算药物重定位领域首次使用。(2)为解决当前药物与疾病数据图结构化后的特征处理问题,提出基于图卷积网络的异构网络信息融合算法-HEGCN(Heterogeneous network information fusion algorithm based on graph convolution network)。以药物-疾病、药物-靶点和疾病-基因相互作用关系数据作为输入。首先进行药物-药物和疾病-疾病相似性矩阵以及药物-疾病邻接矩阵计算,然后搭建药物、疾病之间的异构网络。接着将异构网络输入到加权图卷积网络进行特征提取,最后使用线性解码器重构药物-疾病相互作用关系邻接矩阵。HEGCN算法较当前先进算法相比,性能评估指标AUPR基本提高10%以上,有效提取了药物与疾病数据图结构化后的特征。(3)为解决药物与疾病特征数据的多信息融合与重要信息自动提取问题,提出基于图注意力机制的二部图多信息融合算法-BGAT(Bipartite graph multi-information fusion algorithm based on graph attention mechanism)。以药物-疾病、药物-靶点、疾病-基因、蛋白质-蛋白质和蛋白质-生物功能相互作用关系数据作为输入。首先构建药物-疾病、药物-靶点、疾病-基因和蛋白质-生物功能二部图以及蛋白质-蛋白质同构图,然后将二部图信息融合模块与图注意力机制相结合进行特征提取,最后使用经过改进的多层感知机BMLP进行药物-疾病链接关系预测。BGAT算法较当前先进算法相比,性能整体提高了 10%以上,且针对乳腺癌进行药物预测实验能准确找到乳腺癌治疗药物醋酸甲地孕酮片,表明BGAT模型有效解决了药物与疾病特征数据的多信息融合与重要信息自动提取问题,具有极好的预测能力。综上所述,本文在整理出新的数据集后,根据领域现状和数据特点提出了HEGCN算法,通过五折交叉实验,成功验证了 HEGCN算法的可靠性;在HEGCN算法的基础上,针对性解决了 HEGCN算法的特征提取不可解释和预测模块难以优化的问题,提出了 BGAT算法,通过五折交叉实验成功验证了 BGAT算法的可靠性且通过乳腺癌药物预测成功预测到一种乳腺癌药物醋酸甲地孕酮片验证了该方法的可用性。本文的研究结果对药物的生物学实验具有指导意义,有助于加快药物研发。
其他文献
活性炭作为氰化提金工艺的吸附剂,在循环使用中被污染、堵塞,吸附能力下降,需定期再生。目前,热再生工艺存在能耗高、炭损大、时间长的问题,需进一步优化。同时,考虑到活性炭与水具有良好的吸波性,可采取微波辐照整体加热含水活性炭达到600℃以上以完成再生,无需完全蒸干水份,相较热再生更节能。本论文主要研究了常规加热再生与微波再生工艺参数对载金活性炭再生活性、比能耗和炭损的影响,在此基础上对两种再生方式的工
学位
科技作为全面建设社会主义现代化国家的基础性和战略性支撑,对提升国家创新体系的效能,健全新型举国体制具有至关重要的作用。而随着科技创新驱动发展战略的不断深入,以智能化为核心的新型基础设施为世界的发展带来的是无处不在的“数据”“智能”和“链接”,同时我国海量数据用户所构成的大洲级市场和相关数据价值,为中国新技术的深度创新与融合创造了条件,也为塑造一批能准确把握未来科技变革方向、主导全球行业技术发展和深
学位
医学图像分割是定量病例评估、计算机辅助检测和疾病进展检测的重要环节,在医学图像处理领域起着关键的作用。目前,深度学习技术促进了医学图像处理领域蓬勃发展,大量的方法倾向于利用深度神经网络来解决各种医学分割任务。高精度医学图像分割的主要挑战来自于医学图像任务的固有难题:待分割区域的边界分割难度大与训练数据集匮乏。为了解决医学图像待分割区域边界的分割难度大的问题,提出联合边缘检测与图像分割的多任务学习策
学位
企业文化就如同一只看不见的手,对企业管理活动帮助极大,它主要包括了被广大组织成员一致认同且接受的价值观以及行为准则等。美日等发达国家的卓越企业证明,企业文化对企业的可持续发展具有至关重要的作用。如果企业中的管理活动是企业的新陈代谢,那么其内在的文化是企业的灵魂,优秀的文化能够提升企业整体的精气神,企业之间的竞争实际也可以被看作是企业文化之间的比拼。而在变幻莫测的乌卡时代,外部环境、企业愿景、消费者
学位
随着城市地下空间的快速发展,顶管工程被广泛使用,因受地层条件和地下建筑的限制,管道顶进轴线被迫由直线改为曲线线性。曲线顶管的施工技术和管道受力更为复杂,针对于大直径S形曲线顶管顶进过程中管道受力变化规律、管土相互作用、施工参数控制等问题不够清楚。为此,本文依托宁波市鄞州区220千伏潘桥变迁建工程(大直径S形曲线圆形顶管隧道工程),通过采集现场传感器数据,分析大直径管道环向钢筋应力、纵向钢筋应力、管
学位
近年来,借助中国经济高速发展的大潮流,国内商业银行实现了自身实力的提升和影响力的扩大。如今,中国的改革开放一直在进行并且不断涌现新的成果,银行业的改革也在不断地深入推进,目前在经营管理方面取得了一定的成绩,如规范的公司治理框架、相互制约的监督体系得到初步建立,业务规范性和银行间合作得到提升等。在肯定这些成绩的同时,我们也不能否认当前的商业银行治理结构仍然存在一定的问题,如产权结构单一、董事会和监事
学位
在“互联网+”的发展环境下,国家医改政策频繁推出,使得我国药品零售企业数量急剧增加,从而药品零售企业之间竞争越发激烈。在医改政策的推动下药品零售企业连锁化逐步上升,出现了“大鱼吃小鱼,小鱼吃虾米”的情况,大型药品零售连锁企业疯狂并购中小型药品零售企业,提前为未来国内药品零售市场布局。在竞争激烈的药品零售行业环境下,中小型药品零售企业应该制定可持续发展战略,结合国家政策进行差异化经营,抓住外部环境机
学位
随着城市的快速发展,城市化带来的各种环境污染,噪音污染等城市病导致城市居民生活的环境面临着巨大的压力,对城市居民的生理和心理健康产生了很大的影响。而城市景观对改善城市环境,城市居民心理健康有着至关重要的作用。城市街道绿化是城市景观的重要组成部分,绿化视觉比例对街道空间环境的舒适度有重要影响。目前有大量的研究对城市中的绿地进行评价研究,但是大多数研究仅限于传统的二维空间指标,未将绿视率作为评价指标。
学位
以同济大学生命科学与创新创业大楼项目为载体,研究装配式框架结构的施工关键技术,包括深化设计、节点避让、进场运输、垂直运输机械分配、构件安装等方面的施工控制要点及质量保证措施。
会议
近些年来,智能驾驶技术受到越来越多的关注,它能帮助车辆以半自动或者全自动的方式完成行进、路径规划、障碍躲避等任务。它可以有效缓解交通拥堵,降低交通事故发生概率,提高社会生产力。目前许多公司和科研机构都在智能驾驶领域有所涉猎,并取得了一些瞩目的成就,驾驶的精确度和鲁棒性都达到了较高的水准。但是大多数相关研究都是在硬件平台较为完善的车辆上进行,其巨大硬件和软件成本使得该项技术尚不能大规模落地应用。为了
学位