【摘 要】
:
新药的研发过程往往周期长、耗资大且具有一定的随机性和盲目性。通常,一个新药从研发开始到成功上市平均耗时10-15年,平均耗费超过8亿美元。尽管药物开发的投资大,但产出并不理想。因此,加速创新药物的研发已成为全球的共识。作为药物研发的源头,药物-靶标相互作用的识别在药物发现过程中起着重要的作用。然而,传统的生物实验以及临床试验的方法不仅需要大量的人力、财力,同时还伴随着高的假阳性率和假阴性率。随着机
论文部分内容阅读
新药的研发过程往往周期长、耗资大且具有一定的随机性和盲目性。通常,一个新药从研发开始到成功上市平均耗时10-15年,平均耗费超过8亿美元。尽管药物开发的投资大,但产出并不理想。因此,加速创新药物的研发已成为全球的共识。作为药物研发的源头,药物-靶标相互作用的识别在药物发现过程中起着重要的作用。然而,传统的生物实验以及临床试验的方法不仅需要大量的人力、财力,同时还伴随着高的假阳性率和假阴性率。随着机器学习和生物信息学的快速发展,计算机辅助的药物-靶标相互作用预测方法已经成为一种快速、准确的药物靶标识别手段。本文采用基于集成学习的方法对药物-标相互作用进行预测研究,主要内容如下:(1)药物化合物和靶标蛋白序列的数值化表征。考虑到分子描述符可以根据药物的物理性质、原子数和化学键数这些指标将分子符号表示中编码的化学信息转换成有用的数值,从而可以区分不同的药物分子。因此,本文采用基于分子亚结构指纹的方式来表征药物化合物。为了尽可能多的包含靶标蛋白的生物进化信息,本文使用了位置特异性得分矩阵(Position-Specific Score Matrix,PSSM)来表示靶标蛋白序列。(2)对于数值化表征后的靶标蛋白评分矩阵,本文使用局部相位量化描述符和勒让德矩特征描述算法来客观、高效地抽取具有代表性的生物信息特征。从而获得药物与靶标蛋白的特征向量表示,为下一步药物-靶标相互作用的预测做准备。(3)基于集成学习的预测模型设计。本文采用了两种集成学习分类器,即旋转森林(Rotation Forest,RoF)和随机森林(Random forest,RF),通过分别与两种特征提取算法相结合来预测药物-靶标相互作用。最终,将所提出的模型应用于四个主流的金标准数据集,并与支持向量机分类器以及其他代表性的模型进行了对比。实验结果表明,本文提出的基于集成学习方法的预测模型可以有效地预测药物-靶标相互作用。
其他文献
随着科技的快速发展,人工智能技术在不断得提升,机器人智能化技术也得到人们广泛的关注。机器人在未知的环境下通过对视觉传感器获取的数据进行分析并创建环境地图,利用该地图实现机器人自主定位和构图,也被称作SLAM(Simultaneous Localization and Mapping)技术,随着最近几年机器人、无人机、无人驾驶、VR/AR的火爆,SLAM技术正广泛为人所知,被认为是这些领域的关键技术
<正> 处方:厚朴10克透骨草10克艾叶10克槐树枝7寸葱胡7个用法:将上药放入脸盆内,添冷水2市斤,炉上煮剩1斤左右,将盆端下,先熏后洗。约
<正>我们知道,目前好几种九年级数学教材中二次函数起始课都是只学习二次函数的概念、一般式,然后就是一系列的变式训练,识别大量生活问题中的二次函数,分析二次函数的二次项
雾霾严重影响人类健康,空气微生物作为颗粒物中重要的组成部分,越来越引起人们的广泛关注。空气微生物可以附着在颗粒物上进行迁移,探究不同地区空气颗粒物中微生物的群落结
介绍了风电安装船的工作流程。依据线性微幅波理论及莫里森公式,采用水动力方法确定设计波参数,对升降工况、作业工况、自存工况等载况下的波浪载荷进行了预报,得到了四个桩
目的:分析髓内神经鞘瘤的临床特点,探索微侵袭显微外科术式,提高髓内神经鞘瘤诊治水平。 方法:根据3例髓内神经鞘瘤的临床特点、影像改变、显微外科手术的疗效,结合文献报道58
目前,社区卫生服务中心承担全科医学人才培养任务,我中心自2012年起在"3+2"助理全科医师培养方案、教学条件等方面进行了积极探索。结合当前北京市社区卫生服务需求,提出符合
<正>二次函数是初中数学知识体系的重要组成部分,是历年中考考点聚焦之一。因而它既是教师教学的重点,又是学生学习的热点。那么如何学习二次函数中各个知识点呢?笔者通过多
以一种废弃碳材料替代部分还原剂,在8MVA埋弧炉进行工业化试验。依行业经验对实际生产现状及试验前、试验中、试验后的变化进行评估。结果表明,试验中电耗降低,产品中Al、Ca
天津大学北洋广场是一项综合性园林建筑工程,包括广场、喷水池、建筑小品、雕塑、绿地、亭子与泵房。工程从1984年2月开始设计工作,4月开始土建工程,1985年春全面完成绿化工