低精度蛋白质与小配体分子对接算法研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:HYP0214
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质作为生命活动的重要载体,依靠复杂的空间结构完成生命过程,实现多种生物功能。蛋白质通过与其他分子间相互作用实现信号传导、细胞调控、免疫应答等重要生物途径。随着计算技术的提升,分子对接方法已成为研究蛋白质与配体之间相互作用的重要计算模拟方法。二十世纪九十年代,分子对接计算模拟方法应运而生,在环境工程、药物设计,虚拟筛选等领域起到指导生物实验的关键作用。分子对接属于基于结构的计算模拟方法,通常需要提供蛋白质受体与配体的相互结合位点,以及受体和配体的结构。实验手段测定相互结合位点往往费时费力,且对于非实验背景的研究人员更为困难。此外,目前尽管已知的蛋白质序列高达1.5亿,但是实验解析的结构仅有15万。该数据差异表明提供高精度蛋白质结构不能保证,这也约束了分子对接算法的应用和发展。针对以上两个亟待解决的问题,本文基于副本交换蒙特卡洛采样开发了新的分子对接算法,目标为实现低精度(预测的)受体结构的盲对接问题,即不需要提供结合位点和高精度蛋白质结构,实现配体与受体之间的对接过程。本文的主要研究工作如下:(1)基于集成学习ATP位点预测算法和基于模板打分函数。三磷酸腺苷(ATP)是一种高能磷酸化合物,是生物体内最直接的能量来源,同时ATP位点与潜在靶点药物开发等有着紧密联系。由于ATP位点预测存在正负样本不平衡问题,使得ATP位点预测精度不高。本文基于EasyEnsemble和BalanceCascade集成学习方法开发了ATP位点预测算法。实验结果表明集成学习可以有效的解决ATP结合位点中样本不平衡问题。此外,本文基于结合位点预测算法COACH,设计了基于模板打分函数,并将该打分能量项加入到本文分子对接算法的打分函数中。实验结果表明基于模板打分函数能够有效约束采样空间,提高采样效率。(2)刚性对接算法。本文的主要目标是实现低精度蛋白质结构的分子盲对接问题,因此,本文基于副本交换蒙特卡洛开发了分子对接算法。该算法结合COACH预测结合位点,实现了盲对接。本文使用I-TASSER预测器,构建了低精度蛋白质结构数据集,训练本文对接算法。实验结果表明无论在高精度蛋白质结构或者低精度蛋白质结构中,COACH算法预测准确度高达75%以上。此外,如果预测结合位点中心距离真实配体中心小于8?,本文对接算法最终的预测结果在高精度结构中的平均RMSD为2.03?,在低精度结构中平均RMSD为4.86?。对比结果表明采用预测结合位点手段可以实现分子盲对接。在刚性对接算法训练过程中,针对受体分别为高精度(真实)结构和低精度(预测)结构,应用不同的训练模型。其中,如果受体结构为真实结构,打分函数包含范德华相互作用力和静电相互作用力,并且权重为1。如果受体结构为预测结构,由于局部结构不同程度的破坏,打分函数中增加了预测绑定口袋距离约束项和基于模板的能量项。并且在五次并行副本交换蒙特卡洛寻优过程中,采用五种不同的权重参数组合。实验结果表明,由于能量项中包含配体模板在真实结构中的距离约束,副本交换蒙特卡洛算法采样均匀且充分,最优解的选取方式合理,最终本文算法在低精度蛋白质结构对接效果明显优于AutoDock Vina和DOCK6。(3)基于经验的柔性对接算法。由于柔性对接更能表现蛋白质与配体的相互作用关系,因此,本文在刚性对接的基础上开发了基于经验的柔性对接算法。该算法统计了BioLiP数据库中配体单键的二面角分布,将配体分子内部的范德华相互作用力和单键二面角统计能量项加入打分函数中。此外,增加了配体柔性采样,以保证配体初始结构的合理性。通过与AutoDock Vina和DOCK6的比较,实验结果表明在低精度和高精度结构中,基于经验的柔性对接算法具有较优的对接构象预测结果。本文同时开发了在线服务器(https://zhanglab.ccmb.med.umich.edu/EDock/),该服务器还包含了测试集和独立程序包的下载功能。(4)配体空间聚类算法。实验结果表明低精度结构中的打分函数与构象RMSD之间的皮尔森相关系数较低,因此,采用打分函数选取构象最优解,往往容易陷入局部最优,导致最终的预测精度不高。因此针对低精度结构分子对接,本文开发了配体空间聚类算法SPICKER,用来选取低精度蛋白质对接中的最优解。与XSCORE排序,打分函数排序对比结果表明本文利用空间聚类算法SPICKER在低精度蛋白质对接中平均RMSD最低。
其他文献
低相对速度摩擦诱发振动(LRV-FIV)是摩擦副之间的相对速度较低时,由摩擦引起的振动,其中粘滑振动(stick-slip振动)是LRV-FIV中的一种典型的非线性振动。LRV-FIV广泛存在于工
造型设计是城市轨道交通车辆工业设计的重要组成部分,是技术、文化、审美等多因素耦合的适应性系统,造型设计的演化直接反映了城市轨道交通车辆工业设计的改变与发展机制。为
金融全球化已经成为世界金融系统发展的一个重要趋势,在金融市场加速融合的背景下,国家或地区之间的金融市场相互渗透、相互影响的趋势日益明显。这种影响不仅表现在资产收益
股骨头坏死是一种多致病因素、病理过程复杂且机制尚未完全明确的骨科疾病,根据病因不同可分为非创伤性股骨头坏死和创伤性股骨头坏死。其中,因激素的临床应用广泛,激素性股
基础教育的空间均衡发展是促进基础教育资源优化配置,实现教育公平与提升国民文化素养的前提和重要保障。优质教育资源短缺、城市新区基础教育设施配套滞后等问题的存在,导致
目前,城市网络出行高峰期的常发性交通拥挤,已经严重影响了城市交通网络系统的服务水平。在网络内部累积车辆数接近临界值的情况下,网络内部发生的局部交通拥堵,如路段或网络
强化高校微信公众平台思想政治教育功能的专门研究,既是关注当前大学生思想政治教育、正视问题不足的客观要求,又是立足当下新媒体思想政治教育理论研究相对薄弱、深思理论内
本文针对列车动力学行为具有不确定性的情形,研究列车自动驾驶算法的设计,主要包括两个方面:一、针对高速列车速度控制问题,本文依托于列车的纵向多质点模型,并将列车运行过
混凝土拱桥采用悬臂浇筑法施工在我国起步较晚,在结构安全控制方面尚有不少问题值得深入研究和探讨。悬臂浇筑的主拱在合龙前属于悬臂压弯曲梁结构,施工过程中需借助于扣索、
军事活动,是人类历史演变过程中必不可少的的一种交往方式。本文以军事活动为中心,探讨汉代至唐代东北地区各地方政权的对外交往及其互动关系,以期从东亚整体视域的角度,对东