基于知识的蛋白质结构预测复合打分函数

来源 :华中科技大学 | 被引量 : 1次 | 上传用户:ie286
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质的三维结构对于研究它的功能及其相关的药物设计至关重要,多年来,科学家们提出了各种各样基于氨基酸序列的蛋白质三维结构预测方法。通常来说,蛋白质结构预测包含构象产生和构象筛选两个基本过程,其中,在对大批量构象进行筛选时,能否挑出最接近天然结构的蛋白质构象,结构评估函数也即是通常所说的打分函数的精准与否显得尤为重要。根据统计力学,一个物理系统的稳定状态对应于它的最低自由能,对于包含大量原子的蛋白质大分子当然也不例外,因此对于从物理自由能角度推导的打分函数来说,理想的打分函数应该给予天然蛋白质最低能量分数。由于蛋白质数据库(Protein Data Bank,PDB)中包含了大量通过实验解出的蛋白质结构数据信息,同时考虑到其数量不断增长的态势,基于知识的蛋白质结构打分函数在近几十年获得了广泛关注,在蛋白质结构预测领域取得了很大成功,精细化程度也相应得到不断的提高。然而,出于对计算速度以及打分函数设计简化性的考虑,当前的基于知识的打分函数通常只考虑非成键相互作用,而把构象熵以及共价键的键长势能和键角势能部分排除在外。这种处理方式导致打分函数在对具有良好的共价键结构的蛋白质三维构象进行打分时具有较好效果,但是在面对具有失真的共价键结构的蛋白质构象时较为无力,尤其是在蛋白质结构预测中对大批量预测构象进行筛选时。为了克服目前打分函数的局限性,在本论文中我们进行了如下研究:1、在发展基于知识的打分函数中,一个关键步骤是寻找一个关于蛋白质的合适表征。尽管科研人员在将残基简化成字母表的研究中取得了重大进展,但还没有研究来探讨蛋白质的最佳原子类型数目问题。基于统计力学的迭代方法,我们研究了不同原子类型划分的统计相互作用对势,发现4种原子类型可以满足蛋白质的基本折叠机制研究,而原子层次的精确相互作用分析则需要至少14种原子类型。2、尽管科研人员在蛋白质结构预测中对于势能的计算取得了很大的进展,关于蛋白质结构熵的计算却相对滞后。文中,基于在天然结构中观察到的归一化主链二面角几率分布,我们获得了蛋白质结构的熵,取代了通常的构象熵计算过程中所需要的大规模分子动力学(Molecular Dynamics,MD)或蒙特卡罗(Monte Carlo,MC)模拟。我们设计的包含骨架熵的新型基于知识的打分函数,命名为ITScoreDA或者ITDA(ITerative Score of Dihedral angle and Atom pair scoring function),在16个通用测试集上进行了广泛测试,结果显示,ITDA在从假结构中挑选天然结构时的表现明显优于其它测试的打分函数。这项研究表明了骨架构象熵在蛋白质结构中的重要作用,并给出了一个快速估算熵效应的方法。3、当前存在的打分函数通常只考虑非成键相互作用,并且出于对计算速度和计算简洁性的考虑,忽略了共价键长和共价键角相关的成键势能。尽管这种打分函数在评判经过充分弛豫处理的构象时可能有效,但是在对具有失真键长或者键角的假结构进行排序时会存在困难,尤其是用来在蛋白质结构预测中进行构象筛选时。为了克服这个局限性,在ITDA基础上,我们发展了一个复合的基于知识的打分函数,取名为ITCPS(ITerative ComPosite Scoring function),综合考虑了成键与非成键势能,以及依赖方位取向的相互作用和疏水相互作用。我们将打分函数ITCPS在具有927个蛋白质靶标的18套数据集上进行了广泛评估测试,并与51个其它的打分函数进行了对比。结果表明,ITCPS在52个打分函数中总体上获得了最佳表现,在所有的测试集上均获得了良好结果。在927个蛋白质靶标中,ITCPS识别出了842个相应的天然蛋白质结构,获得了90.8%的成功率,平均Z-score为3.36。此外,ITCPS还展现了在假结构集合中识别最佳近天然态的强有效性,获得了比其它打分函数明显更佳的性能。总的来说,在本论文中,我们就蛋白质结构预测打分函数展开了系统研究,首先研究了蛋白质的原子分类问题,然后对蛋白质结构的熵进行了计算,提出了考虑构象熵的打分函数ITDA,最后发展了综合成键与非成键势能,以及依赖方位取向和疏水效应的相互作用打分函数ITCPS。我们提出的ITCPS模型也有将益于发展其它相互作用打分函数。
其他文献
苏云金芽胞杆菌(Bacillus thuringiensis,Bt)是一种昆虫病原菌,其特征是在形成芽胞的同时会产生由Cry蛋白组成的伴胞晶体,这些伴胞晶体对多种农业害虫具有毒杀活性。因此,Bt成为用于微生物农药最成功的微生物,此外,Bt的Cry蛋白基因也可以通过转基因作物的方式应用于农业上重要昆虫的防治。目前关于Bt Cry蛋白防治昆虫的研究相对较多,然而对于Cry蛋白防治线虫的研究还很有限。植
第一部分骨髓来源抑制性细胞在实验性自身免疫性心肌炎小鼠中的表达规律目的探究骨髓来源抑制性细胞(Myeloid-derived suppressor cells,MDSCs)在实验性自身免疫性心肌炎(Experimental autoimmune myocarditis,EAM)小鼠中的表达规律。方法通过皮下注射小鼠心肌蛋白重链α(Cardiacα-myosin heavy chain,My HC-
目的:1.研究皮肤及汗腺附属器官在胚胎不同发育阶段的基因表达特征,探讨汗腺发育在分子基因水平上的调控机制;2.研究汗腺细胞(SGCs)与骨髓间充质干细胞(MSCs)共培养和MSCs向SGCs诱导培养过程中细胞表型和基因表达的变化规律,探讨干细胞的可塑性在皮肤创面修复和汗腺组织再生方面的治疗可行性。 方法:1.采用HE方法检测不同发育阶段人胎儿皮肤组织的生理结构和特征,其次采用免疫组化、RT-PCR
对于超连续谱产生的研究,在物理机制方面,不仅有助于深刻理解所涉及非线性效应的作用机理,而且有助于深入研究介质色散对脉冲时域、频域演化的影响;在实际应用方面,超连续谱光源由于具有光谱范围极宽、相干性能优良等优点,在光通信领域尤其是波分复用技术、光谱学、光频率计量学、光学相干层析以及军事领域都有广泛的应用。因此,本论文从数值模拟和实验探索两个方面,详细研究了长脉冲和连续光机制下单波长、双波长泵浦光子晶
ABO4型化合物作为地球上广泛存在的一类副矿物和重要的功能材料,其高压研究对于深入了解地球内部相应矿物的存在状态以及改善此类材料的物理、化学和机械性能都有重要意义。钨(钼)酸盐是ABO4型化合物的重要代表,尤其是白钨矿,还是锆石,独居石以及Cr VO4结构类化合物的高压相,因此,对其进行高压物性的研究对于了解上述ABO4化合物的高压行为具有重要的参考价值。本论文采用高压同步辐射X射线衍射和高压交流
细胞自噬是真核生物中高度保守的对细胞内物质进行周转的重要过程,细胞通过动态调控自噬相关蛋白及翻译后修饰来维持各种物质/细胞器在合成、降解和重新利用之间的代谢平衡。细胞自噬作为维持细胞稳态的重要生物过程,受到上游多个生物学过程的调控,例如细胞自噬逐渐被认为受到生物钟和营养信号的双重调控而表现出昼夜节律的周期性振荡,保证机体的代谢活性与外界环境变化及摄食周期协调一致。自噬过程缺陷和生物钟紊乱均被证明与
我是京城与黄土高原的“混血娃”,我生在北京长在北京,但我永远是黄土地的孩子。仔细品味追忆家庭的陈年往事、家乡的风土人情,以旁观者的视角、局内人的体验来感悟和还原身边的历史,明晰自己在历史长河中的角色与使命,我愿意主动承担起家庭、学校、社区乃至国家赋予我的社会责任与历史使命。
期刊
伴随着人工量子器件微小型化、可集成化的技术越来越成熟,人们已经可以在很多平台上实现人工超材料,例如,光子晶体,声子晶体,超导量子电路,冷原子等。人工超材料有着固体材料不可比拟的优势――纯净性,空间结构的可控性以及参数的可调谐性等,使得很多在理论上的物理现象得以呈现。腔光力系统是混杂量子器件中的一类,结合了声学和光学两种模式,主要研究的是辐射压力导致的光声相互作用。腔光力学的研究很多集中于单体上,而
超临界二氧化碳(s CO2)布雷顿循环发电系统具有效率高,结构紧凑,耗水少等优点,适用于太阳能、化石燃料、核电、余热利用和地热等各类能源系统。在近临界区,CO2的物性变化剧烈导致系统的特性复杂。目前,s CO2循环的研究依然缺乏普适性的传热关联式、准确的临界参数测量方法,同时示范系统的运行经验不足、实现效率低等问题也是s CO2循环面对的主要问题。本文从临界传热,临界密度监测,跨临界系统的动态特性
背景 临床上同种异体排斥反应仍然是器官移植的主要障碍,器官移植患者几乎无一例外地要长期、正规地应用免疫抑制剂。同种异体排斥反应的实质是T细胞活化,经典移植免疫学理论认为,T淋巴细胞的活化需要两个信号。信号1为抗原递呈细胞(Antigen presenting cells,APC)表面的主要组织相容性抗原/外源性抗原复合物(MHC/Ag complex),与T细胞表面的T细胞受体/CD3复合物(TC