基于多层网络表示学习的药物靶标相互作用预测研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:marquise
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物科技的发展,越来越多的人类蛋白质被研究者们发现。但是,已知的蛋白质中,可以作为靶标的蛋白质数量稀少,只占所有已知蛋白质数量的很小一部分,导致了大部分药物的靶标蛋白质数量只有两三种。如果可以发现更多潜在的药物靶标相互作用,就可以治疗更多的复杂疾病,从而减少新药物研发的时间、成本和风险,为人类发展提供安全的保障。在探索一个未知的药物靶标相互作用时,传统思想选择使用实验的方法。虽然实验的结果可靠,但是时间周期长,成本高,代价大,不可能对所有可能的药物靶标相互作用进行检测。因此,需要使用计算型的方法为实验验证缩小可能的检测范围,降低实验成本,减少实验时间。目前计算型的预测药物靶标相互作用算法基于数据类型主要分为两类:第一,基于单类型数据预测;第二,基于多类型数据整合预测。但是,这些方法都不能很好的处理多维数据中的噪音影响,而且在提取药物和靶标的特征时,没有捕获到网络中深层的非线性拓扑结构关系,这些因素都会影响最终的预测准确率。本文提出一个基于多层网络表示学习的预测药物靶标相互作用框架MEDTI(Multi-layer network representation learning for drug-target interactions prediction)。通过多层网络表示学习算法,整合多层网络信息,学习药物和靶标的紧凑特征,然后利用在同一空间中相关向量的几何邻近性,将已知的药物靶标相互作用作为监督信息,得到药物靶标相互作用预测得分矩阵。在得到药物靶标相互作用得分矩阵后,对预测结果进行了算法性能分析与结果验证。本文提出的MEDTI框架很好地集成了多类型数据,有效的降低了多层网络中多维噪音的影响,并且通过对多层网络表示学习方法的改进提高了预测准确率,为预测药物靶标相互作用提供了新的视角。在实验中,本文将MEDEI算法与DDR、LRSSL、MDA、MNE方法在统一的数据集中进行比较,结果是MEDTI算法的预测准确率最高。还通过实验证明集成多类型数据有助于挖掘网络中更多的隐藏信息,可以提升预测药物靶标相互作用的准确率。同时在其他实验中,也分析了算法中的参数对算法稳定性的影响。在结果验证中,分别使用不同的验证方式验证预测结果,提高了预测药物靶标相互作用结果的可靠性,证明了MEDTI可用于预测药物靶标相互作用。为实验探索新的药物靶标相互作用缩小了实验范围,预测出潜在的药物靶标相互作用,降低了实验成本,缩短了实验周期。
其他文献
促进职业院校毕业生就业是地方政府的一项重要工作,对当地经济发展和社会长治久安具有重要意义。在促进职业院校毕业生就业过程中,地方政府的主要工作是通过制定和实施促进就
工业机器人在实现制造过程自动化、提高劳动生产率中占有重要的地位。由于工业机器人轨迹规划的好坏直接影响能耗的高低,因此,如何合理规划工业机器人能耗最优的轨迹问题受到了许多学者和机器人生产商的重点关注。本文以LR4-R560型六自由度机械臂为研究对象,首先建立运动学与动力学模型,为轨迹规划的研究和优化能耗的问题提供基础。其次在各关节角度、角速度、角加速度的约束条件下,将能耗最少作为机械臂的运动轨迹的优
教育可以使一个人从愚昧走向睿智,是社会发展的命脉之一,也是一个国家和民族的重中之重。在我们中国的教育中,语文的重要性更为显著,学好语文是学好其他科目的基础。除了中国的中小学生,国外友人来中国留学时,也需要认真学习中文。而作文是中文极为重要的一部分,中文的初学者极容易在写作时出现错误,及时发现错误并更正也显得尤为重要。因此本文实现了作文句子错误识别系统,目的是帮助中文初学者发现自己写作中的错误,也可
排序,也称为调度,是组合优化理论中的一个重要分支。对于传统的排序问题,给定工件集和机器集,为了达到某个目标值,决策者们通常考虑如何将工件最好的安排到机器上进行加工。
近年来,随着我国科技水平的提高,承载重大石化项目的能力进一步增强,越来越多石化项目落户全国各地,然而由于石化项目的特殊性,尤其是政府在项目建设过程缺乏有效的舆论引导,
随着视频质量的提升和交互式应用的普及,用户对网络服务质量需求日益增长的同时也急剧加重了网络流量压力。动态缓存技术通过在网络边缘缓存热点内容,减少向核心网络的请求,能够有效地减轻网络流量压力。以用户为中心的超密集网络通过基站的密集部署和基站组的协同服务,在网络边缘增强流量处理能力,提升用户服务质量。但是,由于用户运动具有随机性,为了保证运动过程中的用户通信连续性,基站协作缓存策略和基站组成员动态更新
合成孔径雷达(Synthetic Aperture Radar,SAR)主要用于对观测场景进行二维高分辨成像,由于其在航空、航天等众多领域的应用,SAR图像解译技术成为目前研究的热点,SAR图像目标特征提取及识别也是其中重要的研究方向之一。SAR图像目标特征提取主要是从SAR图像中获取目标的几何特征、属性特征,可用于对目标的分类识别等。本文主要围绕SAR图像目标特征提取展开研究,主要包括地面车辆目
当前分布在互联网上的APK网站数目众多,质量参差不齐,恶意APK泛滥,容易造成用户误下载后遭受隐私泄露、恶意扣费、电信诈骗等威胁,对这些网站的APK进行实时爬取并监控是降低危害的必行之举。但现有常用的识别页码链接的算法,如GL&CSL、BERyL、XPath最长路径探测等,存在识别时间长、准确率低等缺点,目前常见的提取搜索结果算法,如ViPER、CTVS和STEM算法等,也存在提取时间长、
当前国家产业结构的转型升级、实体经济的发展都需要“融资租赁”。融资租赁融合了融资功能与融物功能,可以降低购买力门槛,因而对实体经济的发展能起到杠杆作用,从而有助于
肽核酸是一种脱氧核糖核酸类似物,具有许多优异的特性,包括与结构化核酸靶点结合的能力、优异的生物和化学稳定性、强特异性的识别能力等。此外,肽核酸的不带电主链可进行独特的实验设计,这些实验设计不能用寡核苷酸或带负电荷的主链类似物来完成。近年来,肽核酸在纳米技术中的应用受到了广泛的关注,已逐渐成为脱氧核糖核酸的重要替代物。碳点是一类尺寸小于10 nm的新型荧光碳纳米材料,由于其强发光特性和良好的溶解性受