蛋白质结构预测方法学研究

来源 :北京工业大学 | 被引量 : 3次 | 上传用户:sunzheng_1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组测序计划的完成,生命科学的重心开始转移到对基因的表达产物蛋白质的研究上来,蛋白质组学已成为后基因组时代的研究前沿和热点领域。蛋白质与配体相互作用以及蛋白质的结构与功能关系是后基因组时代研究的核心内容。研究蛋白质受体与配体间相互作用与识别对揭示细胞中蛋白质的分子生物学机理、计算机辅助药物设计和复合物结构预测都具有重要的意义。由于实验测定蛋白质复合物结构存在较大的困难,近年来,随着计算机处理能力的不断增强以及理论模拟方法的迅速发展和广泛应用,计算机分子模拟方法已经成为研究蛋白质受体与其配体相互作用机制的重要手段。本论文采用分子对接和氨基酸网络方法等分子模拟方法,对蛋白质间相互作用与识别机制进行了一系列基础性的研究工作。论文内容主要包括以下几个方面:(1)蛋白质分子对接打分函数的研究提出了两个打分函数。一个是针对Others类型蛋白质复合物的组合打分函数ComScore。ComScore由原子接触势、范德华和静电相互作用能组成,采用多元线性回归拟合权重。对CAPRI比赛的benchmark 1.0中的17个复合物的对接结构测试结果表明,该组合打分基本能够体现Others类型复合物的相互作用特征,反映出复合物形成前后的能量变化关系,具备一定的从大量采集构象中筛选获得有效结构的能力。ComScore被用于CAPRI的第9-12轮的打分比赛中,在第9轮和第11轮都取得了好的成绩。另一个是基于氨基酸网络的打分函数。蛋白质复合物拓扑结构给蛋白质-蛋白质相互作用机理的研究很多启示。在本论文中,建立了蛋白质的残基网络,其中蛋白质的残基被视为节点,残基之间的接触视为连接。根据残基类型将蛋白质复合物的残基网络分成两种类型,即疏水和亲水残基网络。分析这两种不同类型的网络,发现他们都具有小世界的性质。通过分析网络参量发现,正确结合的复合物构象比错误结合的结构具有更高的界面度值和更低的网络特征路径长度。这些性质反映出正确结合的复合物结构有更好的几何和残基类型互补,同时正确的结合模式对于保证天然蛋白质复合物的特征路径长度起着重要作用。此外,建立了两个基于网络参量的打分项,它们能够很好地反映复合物整体形状和残基类型互补特性。将基于网络的打分项与其他打分函数项进行组合后,提出了一个新的多项打分函数HPNCscore,它能够将RosettaDock组合打分函数的区分能力提高12%。上述工作能够扩展我们对蛋白质-蛋白质结合机制的了解,并可以用于蛋白质结构设计的工作。(2)蛋白质分子对接搜索方法的改进分子对接需要在尽量短的时间里搜索到能量低的结构,因此分子对接方法研究的另一个重要问题是快速有效的搜索算法,即采用新的理论和计算方法提升现有程序的计算效率。Autodock 3.0是一个被广泛采用的分子对接程序,它由美国Scripps研究所Olson等人开发,在预测蛋白质受体和配体间结合模式上取得了很好的成绩。本论文在分析Autodock 3.0串行程序的基础上提出并实现了5种不同的并行方案,从正确性、参数分析(包括5个不同输入参数)、并行进程数量的影响等多个角度对5个并行方案进行了测试和分析。在正确性测试中,并行方案五和原始串行程序分别应用于10个不同蛋白质-小分子体系的对接,对接结果比较证实了并行程序的正确性和可靠性。在参数分析测试中,通过改变能量评价次数、种群个体数、局部搜索概率、局部搜索迭代次数和对接次数等5个不同输入参数,分析了它们对不同方案的影响,这些测试将对并行程序在虚拟筛选中的应用起到指导作用。在并行进程数量测试中,第五个混合的并行方案由于结合多种方案的特点,随着进程数量的增加,程序依然能够充分合理地安排进程资源,保持较高的并行效率。并行化改造能够有效地提升Autodock分子对接软件的计算效率,将为计算机辅助药物设计和虚拟筛选提供一些帮助。另外,还采用蚁群算法对Autodock 3.0程序进行了改进,替换了原程序中进行全局搜索的遗传算法。在22个蛋白质-小分子体系上测试发现,蚁群算法能够有效地改善程序的搜索结果。同时,不管是否采用局部搜索的算法,蚁群算法比遗传算法都具有更好的性能和更快的收敛速度。新的优化算法-蚁群算法的引入将对分子对接软件的改进提供一些新的参考。(3)蛋白质氨基酸网络研究蛋白质分子的三维结构可以被视为由氨基酸组成的复杂网络,对网络性质的分析能够帮助理解蛋白质结构和功能之间的关系。由于蛋白质的氨基酸网络是在蛋白质折叠过程中形成的,通常的网络模型难以解释其演化的机制。基于蛋白质折叠的观点,提出了一个氨基酸网络的演化模型。在此模型中,演化从天然蛋白质的氨基酸序列开始,由两个基本假设进行引导,即近邻偏好性规则和能量偏好性规则。研究发现近邻偏好性规则主要决定通常的网络性质,而能量偏好性规则主要决定特殊的生物学结构特征。应用于天然蛋白质体系发现,该模型能够很好地模拟出氨基酸网络的性质。另外,建立并研究了蛋白质保守残基的无向网络。标识蛋白质结合界面是蛋白质-蛋白质相互作用预测以及蛋白质分类的重要环节。在本论文中,蛋白质结构被视为一个无向网络,其中保守性残基为网络节点,残基之间的接触视为连接。研究发现,保守性残基网络具有介于规则网络和随机网络之间的聚集系数和特征路径长度,属于小世界类型的网络。蛋白质复合物界面的残基比表面残基通常具有大的度值和低的聚集系数。此外,还发现了保守残基的空间聚集是一个普遍现象。保守性残基网络的性质将能够给蛋白质-蛋白质界面预测提供一些新的参量。
其他文献
(嘉宾介绍:深圳大学经济学院国际金融研究所所长)  4月6日,中国人民银行正式上调金融机构人民币存贷款基准利率,金融机构一年期存贷款基准利率分别上调0.25个百分点。加息对中国经济将产生哪些影响?深圳电台先锋898(FM89.8)上午9点至10点播出的《创富赢家》节目主持人孙小美与特约评论员国世平就此展开了讨论。国世平表示,加息窗口已经打开,控制通胀,实现经济软着陆将是重中之重。  孙小美:此次加
以金钗石斛(Dendrobium nobide Lindl.)原球茎为材料,利用间歇浸没式植物生物反应器进行金钗石斛组培快繁的研究。通过优化浸没频率、接种量和培养基蔗糖浓度,获得最佳的培养
2019年11月6日至8日,由南京师范大学文创教育培训中心和《动漫界·幼教365》杂志联合主办,今日童心乐生态教育研究中心承办的“亲近自然 润泽童年——幼儿园自然生态教育
为比较不同土壤水分含量和生长期之间丹参水溶性成分含量的差异,揭示4种丹参有效成分的最佳栽培土壤水分条件和采收期,采用盆栽法控制土壤水分含量,设置土壤水分含量分别为田
菜豆白绢病(SclerotiumrolfsiSac)是海南菜豆生产中的主要病害之一。笔者采用绿邦`98(蔬菜型)防治该病,现将试验结果报道如下:一、试验材料与方法1.供试药剂:绿邦′98WP800倍(北京农业大学产);枯萎立克WP(37%多菌灵草酸盐...
城镇化是我国社会经济发展的必然结果。在这一进程中,如何加强农村社会管理,破解三农问题,实现城乡统筹发展,成为我们必须思考和解决的议题。文章以三亚为例,探讨了三亚在城
一、自然生态教育的四个层次。依照与幼儿自然生态教育的结合程度为轴向加以分析,台湾目前众多幼儿园开展自然生态教育的情形大致可以分为以下四个层次(当然它们不是截然分割
宝宝张开一只手,爸爸每次叫出两根手指头的名称,宝宝迅速让这两根手指头抱在一起。快和爸爸一起试试吧,看看你能做多久不出错。
延续了24年的国税地税收征管体制画上句号。在全国统一的税收标尺下,企业能同等地履行税缴业务与均等地享受税收减免政策,直接降低缴税成本,彰显执法逻辑严肃性,税法权威性与公平
报纸